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内 容 简 介 

成 分 数据 统计 分 析 的 主要 内 容 是 以 成 分 数据 为 下 标的 嵌 计 理论 与 方 

法 ， 其 基础 与 泥 种 分 布 ， 如 塑 辑 正 态 分 布 族 ， 狐 氏 分 布 族 等 有 鞠 . 本 书 在 

此 革 础 土 介 绍 了 成 分 数据 统计 分 析 的 理论 与 分 析 方 法 ， 以 及 这 一 方向 在 国 

内 外 的 最 新 成 果 ， 本 书 每 章 末 附 有 习题 ， 以 便 读 者 更 好 地 理解 本 书 内 容 . 


本 书 可 供应 用 统计 工作 者 、 科 研 人 员 及 大 学 有 关 专 业 商 年 级 学 生 、 研 
究 生 、 教 师 阅 读 . 
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前 襄 

成 分 数据 的 统计 问题 早 就 握 出 了 ， 早 在 1897 年 ， 区 "皮尔 到 
就 指出 解决 这 些 问题 是 很 困难 的 ， 直 到 1986 年 ， 才 有 第 一 本 书 
专门 论述 这 一 类 和 问题， 作者]. Aitchison 也 因 在 这 一 方向 研究 的 
特殊 贡献 ， 荣 获 英 国 皇 家 统计 学 会 1988 年 的 研究 奖章 .此 书 的 
中 译本 《 《成 分 数据 的 统计 分 析 》) 在 1990 年 由 中 辆 地质 大 学 出 
版 社 出 版 ， 艾 奇 避 在 书 的 前 言 中 永明 了 他 写 这 本 书 的 目的 是 : 
“…… 在 于 清晰 而 完整 地 介绍 近年 来 专 为 成 分 数据 而 设计 的 一 套 
新 的 统计 方法 ，…… 强调 提供 有 效 而 可 行 的 方法 ， 而 不 是 进行 详 
细 的 证 明和 推 学 . ”这样 的 写法 对 于 想 进一步 了 解 理论 的 人 人， 是 
会 感到 不 满足 的 . 新 的 方法 主要 是 指 基于 加 性 逻辑 正 态 分 布 的 统 
计 分 析 方 法 . 

成 分 数据 的 统计 分 析 与 单 形 上 的 分 布 有 密切 的 联系 ， 还 辑 正 
态 、 狄 氏 分 布 等 等 都 是 单 形 上 的 分 布 族 . 只 有 把 单 形 上 的 分 布 类 
型 作 -- 些 合理 的 分 类 ， 才 可 能 把 成 分 数据 的 统计 分 析 放 在 一 个 坚 
实 的 基础 上 ， 才 有 可 能 提供 各 种 恰当 的 分 析 方 法 .从 理论 上 春 ， 
这 样 也 比较 系统 和 自然 . 

从 成 分 数据 的 实际 背景 来 看 ， 加 性 、 酌 性 逮 辑 正 态 分 布 仅 仅 
反映 了 一 种 类 型 的 分 布 . 被 划 奇 吉 认 为 不 够 丰富 的 犹 氏 分 布 及 其 
推广 ， 事 实 上 也是 重要 的 . 本 书 发 展 了 这 一 方面 的 统计 分 析 方 
法 ,对 理论 各 实际 都 提供 了 新 的 工具 . 

有 了 单 形 上 的 分 布 ， 混 料 试验 的 设计 就 可 以 有 一 个 比较 恰当 
的 理论 模型 ， 一 方面 既 可 以 说 明 为 什么 泥 料 试验 中 添加 对 数 项 往 
往 会 有 效 ， 另 一 方面 也 推动 了 设计 的 改进 和 分 析 方 法 的 多 样 化 ， 
这 些 内 容 在 艾 奇 示 书 中 没有 展开 ， 而 在 本 节 中 有 -一 些 反映 本 书 
尽量 不 各 艾 奇 池 书 的 内 容重 复 ， 因 为 我 的 观点 和 他 有 些 不 同 . 我 


认为 ,直到 现在 ， 真正 的 成 分 数据 的 分 析 仍 然 是 非常 困难 的 ， 本 
书 一 个 重要 的 和 且 的 是 显示 它 的 困难 ， 但 我 没有 办 法 和 解决， 而 是 希 
望 有 更 多 的 人 来 从 事 这 -方面 的 研究 . 

本 书 断 断 续 续 写 了 几乎 ? 年 ， 因 为 这 几 年 有 不 少 其 他 的 事 
情 ， 扎 使 我 中 断 下 来 ， 所 以 本 书 的 一 、-- 章 和 三 、 四 章 有 明显 的 
差别 ， 我 自己 也 感到 不 满意 ， 由 于 能 力 有 限 ， 只 能 这 样 了 .， 书 中 
有 一 些 内 容 是 没有 发 表 过 的 成 果 ， 但 我 感到 没有 司 完 、 伏 好， 只 
能 重印 时 再 谤 了 . 

本 书 的 前 两 章 ， 邹 国 华 同 志 看 了 之 后 ， 担 出 了 不 少 好 的 意 
见 ， 并 改正 了 不 少 错误 ， 在 这 里 我 表示 衷心 的 感谢 ; 另外 书 中 也 
汇集 了 章 栋 恩 同志 近年 来 的 工作 ， 有 些 即 将 发 表 ， 我 得 到 他 的 人 允 
许 ， 也 反映 到 本 书 中 . 

本 书 的 出 版 得 到 了 中 国 科学 院 出 版 基金 的 支持 ， 我 深 表 感 
谢 . 希望 这 本 书 既 能 填补 我 国 这 一 方面 的 室 白 ， 也 和 希望 为 将 来 的 
研究 提供 条 件 . 我 还 要 感谢 冤 年 来 一 直 合 作 很 好 的 毕 颖 同志 ， 她 
为 本 书 的 出 版 和 编辑 付出 了 大 量 的 精力 . 

希望 得 到 读者 的 批评 种 帮助， 以 便 改 正 由 于 我 水 平 有 限 所 出 
现 的 不 足 . 


张 医 庭 
1999 年 11 月 


第 一 章 准备 知识 。 ns 
1。 维 欧 氏 刘 间 与 单亲 
83. 密 元 正 态 和 分布 
5 多 民 分 


习题 一 … 


参考 文献 … 


§ 1, 诚 分 与 总 量 的 独立 性 ee 


$2. 运 辑 正 态 分 布 


§ 4. . 其 他 成 分 分 布 


习题 二 … 
参考 文献 


第 兰 章 妥 夫 正太 分布 的 统 计 分 析 本 


ED 
$2. 期 望 值 检验 ， 


§§ 3. 主 分 量 分 析 、 典 型 相 美 分 析 esoseseseeseeeeinne 


附录 反正 态 分 布 及 其 推广 . a 


午 5, 与 方向 性 数据 、 球 分 布 的 美 系 i 


汉 英 名 词 对 照 表 


(128) 
(128 ) 


(129) 


{146) 
{149) 
《154 ) 
(157) 


(163) 


(163) 
【164 ) 





第 一 章 ”准备 知识 
$ 1. 2 维 欧 氏 空间 与 单 形 


我 们 在 这 一 节 引 人 本 书 常用 的 一 些 记 苇 ,并 列举 一 些 重要 的 
概念 ,读者 可 以 从 -- 般 的 线性 代数 的 教材 中 查阅 有 关 的 说 明 . 我 们 
假定 读者 已 具备 线性 代数 .数理 统计 的 基本 知识 ,并 对 多 元 统计 分 
析 的 方法 有 一 些 了 解 ， 

用 R. 表示 实数 域 上 的 维 线性 空间 , RR; 中 的 向 量 用 小 写字 
母 表 示 , 如 ea,5,c, zsyyz 等 .向 量 的 分 量 以 相应 的 带 肢 标的 
字母 表示 ,如 














如 Tn 
通常 矩阵 用 大 写字 母 麦 示 , 如 4&,B,C,…,X,Y,Z 等 . 它 的 大 小 
列举 在 字母 下 面 , 如 A 表示 A 是 x 行 m 列 的 矩阵 ,从 上 下 文 可 
以 确定 其 大 小 时 ,就 不 再 列举 ,A 中 的 元 素 用 冯 脚 标 表示 ,如 

A = (Cay), XK = (ry). 
汗 阵 的 转 置 用 "表示 ,A' 表示 将 4 转 奸 后 的 矩阵 ,我们 总 是 把 向 
量 也 看 成 矩 阵 , 当 








时 ,a 的 转 置 a = {a1,42,… an). 于 是 向 量 a 与 5 的 内 积 可 以 用 
a 导出 , 即 


上 
ab = (Cai, sa) | : 
bn 
在 RR, 中 引入 内 积 后 ,R, 就 是 一 个 维 的 欧 氏 空间 .对 于 和 矩 涟 ,有 
时 也 用 它 的 行 向 量 或 烈 向 景 表示 ,通常 都 用 一 个 肢 标 , 带 插 号 表示 
行 指标 ,不 带 括号 表示 列 指标 , 即 


Et 


2 
二 > ab: 3 
i=! 








三 {ual A am)s 








Qtn) 


a 一 (a a 1m): ar 一 【ayGai ci》 
我 们 用 1, 表示 元 素 全 为 1 的 x 维 向 量 , 当 维 数 由 上 下 文 确 
定时 ,用 1 表示 ,于 是 有 
1 


Ta 二 a” 1 三 《al ,an) 








1 
在 统计 中 常见 的 一 组 数据 a1,… ,a 的 均值 和 方差 均 可 用 向 基 、 
矩阵 的 运算 表示 出 来 ,因为 


1 1 1, 
三 之 ai 一 la= a 1= a,， 
1iv 2 1 2 
D(a a)= 2a- na?) 
i=1 | 
= 了 [ao -a(31a) ) 
机 nn 
= Ba (1, -二 )， 
加 
ul 


其 中 = 


了 就 是 nn XH 的 单位 阵 . 








Rn 


当 向 量 & 的 每 个 分 量 均 大 于 等 时 ,我 们 用 a >0 表示 ,类似 的 
az0 就 表示 a 的 分 量 均 为 非 久 的 实数 .然而 矩阵 4 20 则 表示 六 
是 非 负 定 的 方 阵 ,A >0 表示 4 是 正定 阵 . 


向 量 之 的 一 个 线性 函数 > arrs 可 以 写成 cz ,其 中 常数 向 
其 a 是 由 系数 a1,…,an 形成 的 .于 是 线性 方程 组 


加 + amz2 t+ + dmtm = b1, 


nit + anix2 tt rnTn = bn. i 


可 以 写成 矩阵 或 向 量 的 形式 : 
人 
或 
AIT 十 如 2 十 十 anrm = bb, 
而 
Xl 1 
A= (ay), 一 中 p= |:;|, 
Tn br 








A 也 可 写成 (al #2 机 am) 
给 定 矩阵 A =(al az an) 后 ,A 的 列 向 量 a1,…,a, 所 张 
成 的 线性 子 空 间 用 只 (A) 表 示 ， 即 

R(A) = 14 | :rE R.|. 
很 明显 ， 民 { 妨 ) 是 KR, 中 的 一 个 于 空间 . 当 记 各 = 和 白 时 ,我 们 称 &a 与 
五 正 交 , 记 为 a_L#. 车 a 与 集合 S 中 每 一 个 向 量 都 正 交 ,就 记 为 
asS. 如 果 请 与 拭 阵 及 = (et ea om) 中 的 每 一 个 列 向 量 都 
正 交 , 即 5 上 Lai 二 1,2.… ,mm, 刚 5b 上 RR( 六 ). 与 -RCA ) 正 交 的 向 量 
形成 一 个 子 空 间 , 称 为 RC(A) 的 正 交 补 空间 , 记 为 RCA)-, 嗓 

R(A)T= {xz :zx | RC(A)|. 
很 明显 ,RR{A)+ 也 可 以 用 另 一 个 形式 表示 , 氏 

RIA)Y= {rz:;zxT| gi = 1,2, ,ml| 


一 0 
= jz:4z= 0 
考虑 一 个 特殊 的 正 交 补 空 间 , 它 在 今后 的 统计 分 析 中 起 重要 
的 作用 . 若 a 1 ==0, 则 称 ae 是 向 量 zx 的 一 个 对 比 ,a 称 为 这 个 对 
比 的 系数 向 量 . 如 


XI Tas 1 一 272 十 了 ns 
1 
一 十 … 十 二， 
工 1 2 12 2) 


都 是 z 的 对 比 .很 明显 ,R(1)+ 就 是 对 比 系数 向 量 组 成 的 子 空间 ， 
它 就 是 方程 

fr 一 站 
的 全 部 的 解 . 

为 了 方便 ,今后 用 一 些 记号 代表 只 , 中 的 一 些 特定 的 集合 .这 

些 集合 是 : 
Ri= :rx :XE Rr >0,i = 1,2,..…,n}, 
Ri= ix :x ER,z0,i = 1,2,.…,n}, 
‘= i :xXE Ri,lr = 1}, 
5S= |r:zrx€ Ri,lr = 1|, 
= Ix :rE Ri,Tr < 1|, 
D= Ir:r€ Ri,Lr 1}, 
其 中 集合 5, 通常 称 为 n 维 空间 中 的 单 形 ,或 简称 为 单 形 (有 的 书 
上 称 为 单纯 形 ),S, 是 单 形 S。 的 内 部 . 

或 分 数据 ,也 就 是 由 百分比 组 成 的 数据 ,因此 成 分 数据 的 取 值 
范围 就 是 单 形 S。, 由 于 讨论 时 在 数学 上 更 便于 处 理 , 我 们 常常 先 
讨论 S, 内 到 和 值 的 情况 ,所 以 5, ,S。, 是 我 们 今后 经 常会 遇 到 的 集 
合 . 

1 


生 _ 
如 果 a; 守 0,i=1,2,:…, 记 ,上 且 》'w; = 1, 也 即 吕 = ES,, 
z= 








A 
“4: 


Tn a er a 


2122 ,Dk 均 为 民 。 中 的 向 量 , 则 称 

albl + azb2 + 二 CC = (bi bo ba 
是 Bb1,… ,bh 的 凸 线性 组 合 . 用 矩阵 B = (4&1… az] 来 表示 ,就 是 : 
只 要 a E 5;Ba 就 是 B 的 列 向 量 的 一 个 凸 线性 组 合 ,集合 

lIBa :a€ S| 

就 是 向 量 Pi ,bz,…，, 所 生成 的 吓 包 .RR 中 一 个 集合 对 凸 线性 组 
合 是 封闭 的 ,也 即 其 中 任意 有 限 个 向 量 的 凸 线性 组 合 仍 属于 这 个 
集合 ,别称 这 个 集合 是 西 集 . 很 明显 , R* ,R+ ,SS DD; , DD, 都 
是 凸 集 ,51,…, Ps 生成 的 上 同 包 1Ba :a 5 S| 是 包 合 起 ，…, 县 的 最 
小 的 凸 集 . 





2. 基 和 成 分 


给 定 一 个 向 量 wER, 20,w = (wo,w1,…,w,) ,我 们 就 
称 w 是 -个 枯 向 量 , 令 


i = 0,1,2,",n. (2.1} 


则 称 : 是 w 相应 的 总 量 ,z = (xzoyzl1 wo) 称 为 ww 相应 的 成 
分 , 当 w 明确 时 ,简称 为 总 量 、 成 分 . 易 见 mw:z,z 有 下 列 关 系 : 
w= tr,T = wt oa 关 0)， 
人 = 1(w A 0). (2.2) 
为 了 今后 讨论 方便 , 以 下 无 特殊 声明 时 ,我 们 总 假定 wE 
RR;41, 于 是 相应 有 
w= trir= wt!, 
| > 人 0 工人 01z = 工 . 
此 时 ,我 们 对 向 量 w 或 z 的 各 个 分 量 取 对 数 是 有 意义 的 , 取 对 数 
后 形成 的 向 量 分 别 用 Inw 和 lnxw 表示 , 即 


(2.3) 





lnewo: nro1 . 
lm fnzri 
Inew = |， Inx 一 
nw [Inzn 
我 们 称 lnw 的 一 个 对 比 a lnw 是 ww 的 一 个 对 数 对 比 . 对 成 分 
Zz 也 是 一 样 , 当 le=0 时 ,ainz 称 为 z 的 一 个 对 数 对 比 . 
如 果 把 xz€ Su+i 看 成 一 个 基 向 量 , 则 x 相应 的 成 分 还 是 它 自 
己 .因此 基 疝 量 w 和 相应 的 成 分 z 可 以 看 成 是 mw 在 S,,1 上 的 * 投 
影 ” ,x € S.:1 时 它 的 "投影 "还 是 自己 ,不同 的 w 可 以 有 相向 的 
“投影 ”把 这 一 概念 更 一 般 化 ,就 引出 形状 和 大 小 的 抽象 概念 ， 
定义 2.1 假定 wRii1; 即 w 是 一 个 基 向 量 , 如 巢 G(w) 
是 一 个 w 的 正 秆 阻 数 , 且 有 . 
G{lrw) = cG{w), (2.4) 


对 一 切 c>0 成 立 , 则 称 GCo) 是 w 的 大 小 (Size) , 令 
zol) = wg/G(w), (2.5) 


称 zctw) 是 GLw) 这 个 天 小 相应 的 形状 (shape). 
从 定义 2.1 可 以 看 出 ,总 量 上 是 一 个 w 的 大 小 , 它 相 应 的 形状 
就 是 成 分 z .很 有 明 电 ,w 的 大 小 可 以 列举 很 多 ,如 
(DR) oo mo 
OSI 
等 都 是 ， 它们 各 自 相应 的 形状 是 不 同 的 . 然而 形状 向 量 之 间 却 有 如 
下 的 重要 关系 . 
定理 2.1 假定 wERii Gi G2 是 mm 的 两 个 大 小 ,xiyg> 
是 Gi,G; 分 别 丰 应 的 形状 , 则 有 
zi(w) = za w)/G( zo wm)). (2.6) 
证 明 zj(w)=w/GI(w) 


上 EC 
= zw) /Gm /G2 w)) 
三 zw) /OI( zal wm)), 








rE 


这 就 告诉 我 们 ,形状 向 量 是 可 以 相互 表示 的 . 
现在 直入 子 成 分 的 概念 . 成 分 的 一 部 分 并 不 再 是 一 个 成 分 向 
量 ,区 如 将 成 分 向 量 x 分 为 二 段 , 即 


加 四 

Ti2) : 

XD) 是 nn;X1 的 向 量 ,i=1,2. 由 于 zj 交 0, 必 然 有 0<Lzrin<<1， 

i 三 1,2, 它 们 各 自 的 分 量 之 和 一 定 小 于 1, 不 能 是 一 个 成 分 向 量 ， 

子 成 分 是 把 成 分 分 解 为 若干 段 ,把 每 一 段 看 成 一 个 基 向 晶 ,这 些 基 

向 基 相 应 的 成 分 称 为 子 成 分 .用 数学 的 术语 描述 就 是 如 下 的 定义 . 

.定义 2.2 把 基 向 量 w 和 相应 的 成 分 向 量 x 同样 分 成 上 段 ， 
即 有 

I | 天 


rl) | 好 1 


-让 一 ， 拘 一 














TES HE cu) 
区 十 和 因 2 寺 十 mi 二 十 1. 

令 SS 一) ! 二 二 1,2,…, 色 ,; 则 称 Si 是 的 子 成 分 . 

当 ;之 1 时 ,St 是 一 个 向 量 ; 当 w;=1 时 ,Stj) =1, 这 表明 成 
分 向 量 x 的 子 成 分 在 n; = 1 时 需要 特殊 考虑 ,这 一 点 在 今后 的 讨 
论 中 会 经 常 过 到 . 男 一 方面 ,从 子 成 分 的 定义 还 可 孔 夏 出 子 成 分 
Sj 有 以 下 的 性 质 : 

(DS = wn (lw) 1 

这 是 因为 St = zt (dz 1= tro(tl rn) 1 而 好 人 
= w(0 ,于 是 就 有 SG) = wiry (toto0) .这 告诉 我 们 子 成 分 5 
既是 zi;) 的 成 分 也 是 wj 的 成 分 ,wj;y 的 有 些 性 质 可 以 在 So 上 
反映 出 来 . 


{2)Siy 的 对 数 对 比 一 定 是 zx 的 对 数 对 比 , 也 是 of 站 的 对 数 对 


WA 


比 . 
这 是 由 于 对 数 对 比 的 两 个 性 质 推出 的 ,这 两 个 性 质 是 :成 分 x 
的 对 数 对 比 一 定 是 基 w 的 同一 个 对 数 对 比 (同一 个 指 系数 向 量 相 


了。 





同 );w 的 一 部 分 wp 的 对 数 对 比 也 是 w 的 一 个 对 数 对 比 .用 数学 
的 式 子 表示 就 是 ; 

因 次 当 a 二 站 时， 

a nrz= a lntw/t) = a nw ~ a Tin 
一 Cn; 

当 aint "0 时 ,at lho) = 0,0,.… ;a0 " ;0)Inw, 昭 

a 二 《0,0 ,20D 0,0), 则 有 
a r= oy h n= 0,aclnowe) = a lnw. 
一 个 对 比 的 系数 是 一 个 n+ 1 维 的 向 量 , 它 满足 齐 次 方程 a’1=0， 
也 即 Ta = 0. 这 一 齐 次 方程 的 全 部 和 解 基 Rt1) 的 正 交 补 空间 
I 

R+(1), 是 一 个 n 维 的 子 空间 , 它 的 一 组 基 是 | 四 | 冯 一 逢 了 的 
nt 个 到 襄 量 , 它 相 应 的 投影 矩阵 是 


了 +1 Pi Trl 





1 , 
nrir- 
容易 验证 : 
(1 -ll)t=0 
atl x+1irTj=0, 
因此 任 一 a= {I+1 一 二 1 了 jz,xE Rts 就 一 定 有 性 质 a 人 1 
二 0, 也 有 即 a 是 一 个 对 比 系数 ;反之 ,和 任 一 对 比 系 数 a , 它 一 定 可 以 
i , I 
表 成 (111 一 11 或 | 
到 . 


8. 这 些 在 今后 的 讨论 中 都 会 用 





和 3， 多 元 正 态 分 布 


这 一 节 概 要 地 叙述 多 元 正 态 分 布 的 一 些 基 本 的 性 质 , 一 些 较 
长 的 证 明 都 不 列 出 ,读者 可 以 参阅 一 般 多 元 统计 分 析 的 教材 ， 
n 维 多 元 标准 正 访 分 布 用 六 (0, 了 ) 表 示 , 它 的 密度 本 数 写成 
"总 - 





p(x) ,pl 文 ) 的 表达 式 是 
y(z) = (二 ei (3.1) 
容易 看 出 , 当 随 机 向 量 z， 遵从 NI 分布 时 , 它 的 分 量 Xl, 
zn 是 独立 、 同 分 布 (0,1) 的 随机 变量 , 期望 值 为 0, 方 差 是 1. 
N(0,1) 是 一 元 的 标准 正 态 分 布 . 
我 们 用 Ex 表示 随机 向 量 z 的 期 望 值 组 成 的 向 量 ,war(z) 表 
示 工 相 应 协 方差 矩阵 , 即 





Fx 
Ex = : 


有 








Er 
Var(r) = E(x — Er(x — Er). 

当 x 一 NN(0,14) 时 , 若 y= Ax+k, 则 有 

Ey = ARTF 十 下 二 大 

Var(y) = AE(x — Ex){x — Ezr)A’ = 4A 

内 要 A4 >0,y 就 有 密度 ,记忆 = AA 后 ,y 的 分 布 密度 是 


( 专 ) | > -了 on, (3.3) 


这 是 一 般 sm 维 雪 元 正 态 分 布 , 记 为 NI 忆 ),p 的 维 数 或 盖 的 阶 
数 就 是 分 布 的 维 数 .对 于 N(p ,也 ) 我 们 用 引 理 的 形式 列举 它 的 性 
质 , 并 给 以 扼要 的 证 明 . 

引 理 3.1 设 y~N(p,2), 忆 >0, 则 有 

(DE-$y -~ NO, 1); 

(Dy pa) Dy- (m). 

证 明 当 23;>0 时 , 它 的 特征 根 41,…, 4 均 为 正 数 ,4* 对 任 
一 实数 wx 均 有 意义 .由 对 角 化 的 定理 知道 存在 正 交 阵 厂 使 


Al 0 
>=T 


(3.2) 








rT., 








0 A 





我 们 规定 








站 和 A 
于 是 2 二 ,> -二 均 有 意义 ,上 且 了 二 六 -二 一 末 - 二 > 二 了 

由 于 y 的 线性 簿 数 依然 是 标准 正 态 分 布 随机 变量 zx 的 线性 
务 数 ,因此 它 还 是 正 态 分 布 ,只 和 需求 出 它 的 期 望 值 与 协 方差 矩阵 ， 
就 可 以 完全 确定 它 的 分 布 ,而 


ES $y p) = 5 EE(y) -p=0, 


_1 1 1 
Var > Sy -£0))= > IVar(y)2) ?= I, 
这 就 证 明了 (1). 由 工 = J-(y 一) 一 N(0,1,), 知 道 
(yp (yj)= r= D2 
i=1 
因此 从 x1,… ,zn 独立 同 分 布 Nt0,1) 得 到 
TT ~ Xm), 
这 就 证 明了 (2). 
?| ee | 2 2, 
一 ” 此 二 3 2 三 3 
3(2) 2 之。 








Lt2) 
则 有 
(yn ~N( pn, 2a),i=1,2; 
《25300 对 yw 的 条 件 分 布 还 是 正 态 , 且 
fe = p+ Ds Dy0) - p09), 
Varlyoy |y02) = D1 - 2 Dn: 
证 明 这 只 需 将 (3.3) 的 分 布 密度 用 边缘 密度 和 条 件 分 布 密 
度 萎 积 的 形式 写 出 就 得 . 关键 是 指数 上 二 次 型 的 分 解 , 用 到 了 一 个 


* 0 ， 


(3.4) 





矩阵 分 块 求 逆 的 公式 ,就 是 
3 2 2 0 
2), 2 0 0 


十 


一 了 














~ D3 DD 加 1), 


其 中 





>. 一 27» 一 2 2 > 
用 这 个 公式 ,就 得 | 
(一 AD Cy-p) 
= {Cy pW) Cy) — p02)) ) 

2 > 
2 之 2 
= (> 一 po DH yo — pop) 

十 (yo -pa ~ 2 ny — pn)) 

x Dy (02) 


-过 (yo — wz) 
全 Qi1+ QQ. 
于 是 分 布 密度 (3.3) 可 写成 


( 直 ) (2 ,| Dy ) te 


YD TT KO 
V2) 2) 














外 
地 


其 中 
Qi = (0 -AD) Dr Cy - pe), 
Q2 = 《ya) - a 2 7 (v0 ~ 4), 


| 一 1 
a 二 产 (2) 十 之 2 ye 一 应 全) 


就 能 得 所 要 的 结论 . > 分 块 后 ,相应 的 有 








2 2 
121= 5 了 
一 [2 ||, > 
= | 321)| 3» 





同样 地 有 | | = | yw| | DoDD | = | 22 | D2|. 
对 分 决 求 公式 也 是 美 似 地 还 有 男 一 表达 式 .从 密度 {3,3) 分 块 后 
写 出 的 乘积 就 可 得 : 

YD 一 NIuib Zn); 


yo ly ~ Ngo + Da Dtyw ~ p00), 2 .1) 
将 脚 标 1 与 2 对 换 ,就 可 得 yc» 与 ycw1 yw 的 分 布 ,于 是 就 证 明了 
本 引 理 . 
现在 来 讨论 一 个 特殊 的 分 布 ， 它 与 第 二 章 中 单 形 上 的 逻辑 正 
态 分 布 有 密切 的 关系 ， 
假定 y 一 N(0 ,27)， > > 0 ,这 里 很 定期 疹 为 0 是 避 禹 扒 
导 过 程 中 形式 上 过 于 庞杂 . 考虑 y 的 m 一 1 个 对 比 , 求 这 些 对 比 的 
联合 分 布 密度 . 
令 下 =( 了 ,_1 一 414),z = Fy. 广 意 此 时 < 是 zm 一 1 维 的 向 量 ， 
实际 上 
Zi yy Yai = 1,2,.",m~1. 
现在 的 问题 是 要 求 = 的 分 布 密度 .由 于 = 是 y 的 线性 阔 数 ,因而 * 
也 是 正 态 分 布 . 要 写 出 zx 的 密度 ,只 需求 = 的 期 望 Ex ,z 的 协 差 阵 
Yarfz) ,然后 再 求 得 Var(z) 的 道 就 行 了 . 今 
Fx = FEy = 0, 
Var(z) = FVar(y)F’ = 下 > 下 
如 何 求 出 下 忆 扩 的 道 阵 就 成 了 求 z 分 布 的 核心 间 题 .解决 这 个 问 


* 2 。 


题 希 要 再 一 次 应 用 分 块 求 着 的 公式 . 当 我 们 已 知 了 一 和 N(0, 纪 ) 的 
密度 时 ,实际 上 我 们 已 知 的 是 羡 ! 的 表达 式 , 如 将 王 -! 和 守 一 样 
分 块 写 出 , 记 为 








区 > | 己 " > 
5, > 加 本 Y 1 yi ” 
则 由 分 块 求 道 公 式 可 知 

= 2 一 (2> 一 3) 
也 即 有 
(二 ) = 3D, DD 


(二 ) = 3 2 
如 将 纪 -! 作 为 已 知 的 ,要 求 中 的 纪 ,, 则 有 
3, Sn 和 2(Y 2 (3.5) 
现在 我 们 用 (3.5) 来 求 (FF') ' .考虑 





I -lll: -1 fF 
: 了 1 = Wb 1) 
FOF’ Fol A A 

= 全 及 = ， 
UF 415)1 A Az 








很 明显 ,我 们 要 求 的 (下 SFY)- ! 正 好 是 (3.5) 中 相应 庶 1. 因此 用 
公式 (3.5) ,就 得 
(下 YEF = A = 4 — AL(A2)-1A2, 
由 于 
AU AR 
陋 AZ 





-1 


F -1 
而 图 仍 可 以 用 分 块 求 逆 公式 得 到 ,因为 








lm-1 0 一 
| | [ep 
Q 0 m| 1 
Tn -1 工 1 工 1 
一 nm nt 
工人 1 
nt m1 
于 是 
1 ~ 
1 人] - pe 一 并 -二 1 > 2, 
21 22 21 
432 如 1 1 ly 5 
PE mm 
I 上 tl 工 1 
x 六 7 
_1 1 
nt nt 
因此 得 到 
1 ， 
41 12 了 
全 
21 22 
和 /2 2 -二 


= | (1, 0) -二 41 


A?= [Cm 0) -二 11| 


1 ,0 -1 
A2Y= ml > 1. 


而 
(FF) = A = A - AD2(A2)-143 


= | (5 0) -于 | 人- 二 2] 


yy 


1 


2 
[Cm 0) -LD TS 


| 
= [(1, 0) 一 十 1 于 二 (全 -二 1] 


0 
EE 
1 1 


= [Cn 0) -I 1 | 


x[( 和- 二 1 


La 








之 YE 

令 
| yD Bu Bizl 1 
B= 2) 一 TI 全 Bz, Bo 1 

出 就 得 : 

若 y 一 N(0,8),z=Fy,F=(I,_! -1), 

于 是 = 一 NI0, 开 FE )z 的 密度 为 
m-l 
[去 ) 1Bu | Se 3*Buae, (3.6) 

答 易 验证 , 斥 阵 B 是 退化 的 , 它 的 秩 是 sx 一 1, 而 且 





| 14 二 
B1= 2 1 el 1=0 
有 关 的 进一步 讨论 我 们 留 作 习题 . 上述 结 果 归 结 为 
定理 3.1 若 y~ NN(0,2)),z= Fy,F= (1 -1D, 则 
Bi Bi 


Ba By 
m~1 1 


A ”wm 1 一 
令 B= 了 TI- LL 之 - 后 ,就 有 


2 


1 











多 一 NO0, BI). 

与 正 态 分 布 有 关 的 男 一 个 分 布 基 反 正 态 分 布 (inverse gaussian 
distribution) .不 要 从 名 词 上 误解 为 它 是 服从 正 态 分 布 的 随机 变量 
的 着 1 的 分 布 , 取 这 个 名 词 是 因为 它 的 特征 函数 恰好 是 正 态 的 
反 函 教 ,这 一 点 在 下 面 求 得 特征 函数 就 可 以 说 明了 . 尽管 反正 态 分 
布 在 和 年 伐 中 期 就 提出 来 了 ,但 并 未 引起 重视 ,直到 ?30 年 代 , 一 - 
些 实际 应 用 表明 这 一 分 布 是 很 有 意义 的 ,进一步 的 研究 表明 它 与 
过 程 的 一 些 特 征 量 有 关 . 我 们 国内 这 一 方面 在 教材 和 论文 中 还 没 
有 出 现 过 这 一 类 分 布 , 因 此 本 书 稍 多 地 给 以 一 些 介绍 ,以 期 引起 理 
论 和 应 用 方面 的 兴趣 ,正文 中 我 们 只 论述 与 成 分 数据 分 析 的 有 关 
内 容 ,在 附录 ( 见 本 章 习 题 后 的 附录 ) 中 ,对 它 的 进一步 推广 和 应 用 
作 一 些 介绍 . 

在 处 理 反正 态 分 布 时 ,需要 一 种 求 积 分 的 微 商 方法 ,我 们 先 引 
入 一 个 积分 求 值 移 公 式 ,以 它 作 为 工具 ,导出 反正 态 分 布 的 密度 以 
及 有 关 的 统计 性 质 . 

首先 我 们 证 明 

| te (tg = VE (3.7) 
Y a 之 0 都 成 立 . . 

显然 ,ae 二 0 时 ,(3.7) 式 是 矿 函数 的 一 个 熟知 的 等 式 , 因 a&a=0 
时 上 式 是 成 立 的 , 记 {3.7) 式 左 端 为 Rta), 它 是 a 的 销 数 , 易 见 
有 ;对 a >>0 

da) - = £4 0) le (ef)az. 


令 z= 卫 , 则 t= 所 上 且 dt= -号 dz， 代入 上 式 右 端 ,得 到 


dee) = 让 | e- (zx+2) 7 


=- 广 F(o). 


注意 到 F(0) = 元 ,于 是 解 上 述 微 分 方程 就 得 (3.7) 式 . 
n 16 四 


将 (3.7) 式 两 端 均 对 a 求 微 商 ,就 得 


| ed = ,| 亚 e 2 . (3.8) 


实际 上 ,(3.8) 式 也 可 以 通过 积分 变量 的 变换 得 到 ,只 要 留心 上 面 
导出 微分 方程 时 的 计算 ,就 可 以 马上 知道 相应 的 变换 是 什么 .从 
(3.7),(3.8) 式 可 以 导出 田 两 个 等 式 , 我 们 只 证 其 中 之 一 , 另 一 个 
留 给 读者 . 令 对 5>0 有 


六 :ae Et ) dr 
0 


= | V5(6t) -入 er 全 db) 


de) 


”= 所 0 HH 2C 
-Ee 
F . 
因此 有 
[rie )as = es, 4 ) 
| 
| 1 ~b{ es jd = Ee 
注意 到 
a +#)- 6 一 2wa + 2 )+26ya 
= 2( -Vay +26d, 
从 (3.9) 式 就 得 到 
VE de = 1， 
To 
(3.10) 


a} Bie tg = 1. 
从 (3.10) 就 可 以 引出 反正 态 分 布 .车 随机 变量 二 的 分 布 密度 


17°* 





3 有 
plt) = A 2e 2 > 0, (3.11) 


其 中 参数 产 >0,>0, 则 称 & 遵从 反正 态 分 布 ,用 INLn ,pA4) 表 

示 . 下 面 我 们 将 证 明 p 是 & 的 期 望 值 ,pWX 是 & 的 方差 ,因此 这 一 

记号 与 正 态 的 写法 一 致 .在 求 期 望 方差 之 前 ,我 们 先 证 一 条 引 理 . 
引 理 3.3 车 &~IN(p ,pAA), 则 它 的 逆 $71 的 分 布 密度 为 


V 去 :去 (2) ， :>0. (3.12) 
证 明 注意 (3.10) 中 第 二 个 等 式 中 取 a = p2,6 = 了 25 左 问 


被 积 函 数 就 是 IN(yge ,yi A4) 的 密度 .而 PCE !<1)==P(E>+1 1) 
_ 『 /六 ee 4 

= | 27 “8 2 dx, 两边 对 f 求 微 商 ,就 得 所 要 的 结 
论 ， 

(3.12) 相 应 分 布 称 为 道 反正 态 分 布 ,意思 是 它 是 反正 态 分 布 
IN(g, pA4) 随 机 变量 & 之 逆 E 1! 的 分 布 . 因为 它 的 英文 名 称 是 
reciprocal inverse gaussian distribution, 它 的 记号 记 为 RIN(p ,p37 
4). 很 明显 ,Ee :并 不 是 wm 方差 也 不 是 ji*AA ,这 一 写法 重点 是 表 
明 它 是 IN(g 2 分布 随和 机 变量 之 道 的 分 布 . reciprocal 一 词 还 
有 相互 的 意义 ,实际 上 也 是 , 当 ? 了 RING AAA 时 ,7 就 以 反 
正 态 分 布 IN(g ,pz2A) 为 分 布 , 它 们 是 相互 为 道 分 布 , 因 此 今后 有 
关 的 结论 我 们 都 成 对 给 出 .我 们 往往 其 对 一 个 分 布 给 出 证 明 , 另 一 
个 分 布 因为 方法 类 似 就 不 证 了 ,读者 自己 去 证 . 

比较 (3.10) 各 (3.11),(3.12), 可 以 看 出 反正 态 分 布 的 参数 可 
以 有 不 同 的 选择 ,(3.10) 是 用 a ,5 两 个 参数 ,{(3.11),(3.12) 是 用 
4,& 这 两 个 参数 ,它们 之 间 的 关系 是 

a = p02,b = 这 = 六 .( 即 2ab = 》) 
有 时 为 了 证 明 简 洁 , 选 用 a ,5 或 A, 5 都 是 可 以 的 ,1,m 的 统计 意 
义 比较 明显 .下 面 我 们 来 求 分 布 的 短 母 函数 ,从 而 导出 它们 的 期 
望 、 方 差 的 表达 起 以 及 其 他 的 性 质 . 


= 148- 


a 


定理 3.2 若 &~IN(p,w3A4), 则 有 
gi(0) = Fe = exp 1 1-2n 60/)1, 











1 203 A 
ge'(0) = Eee = (1- 和 | exp|2 01- VT 35 万) 


(3.13) 





证 阴 今 ge( 90) 三 Ee 


ee 
_ 的 风光 te Bf + 
一 _ /Ep eV 5686 
一 本 
用 a 一 /2,6b=363 代 人 上 式 右 端 ,就 是 (3.13) 第 一 式 .类 似 方法 可 
以 证 得 第 二 式 . 
现在 来 说 明 反正 态 分 布 的 命名 , 正 态 分 布 N(u ,oz) 的 矩 母 函 
数 是 e+? , 它 取 对 数 后 就 是 jt + 分 刀 , 令 它 为 ~ 9, 就 得 
Sr + 二 = 10. 
将 8 看 作 常数 ,z 看 作 变 元 , 解 上 述 一 元 二 次 方程 ,得 到 
EY 0 (1 VT 99) 


很 明显 ,上 式 右 端 与 (3.13) 中 ge(96) 的 对 数 完全 相似 ,在 这 个 意义 
上 , 它 与 正 态 的 正好 相反 . 


有 了 定理 3.2, 可 以 得 到 一 系列 重要 的 推论 ,我 们 逐一 给 以 说 
明 . 


系 1 若 &~INiy,p3A4), 则 有 





£ 一 





|E(&) = 户 ， 人 = p34 

E(g 1) = T+;Var(#) = -442 (3.14) 
利用 Inge( 9 展开 式 的 6 与 多 的 系数 ,就 可 求 出 的 期 望 与 

方差 .因为 


Ings( 全 一 (1 — {1 228/4)4) 





= p+ 六 全 0 + 

同样 的 方法 对 Inge-1(9) 展 开 就 得 EC& 1 与 Var(& 全. 

系 2 车 x1,…,xs 独立 同 分 布 INCp,p3A), 则 SS= zit+… 
+ x ~IN( npg, n/aA). 

证 阴 Ee = Ee mm) 一 I Eee = (Ees:)" 

= va) 
由 于 ES = nExi = #4 Var(S) = nVar(z1) = ms 注意 到 
IN( np , np3AA) 相 应 的 矩 母 沙 数 是 在 表达 式 中 用 ng 代 p,n24 代 
A 就 可 由 ge(8) 得 到 , 即 为 
exp 2 (1 —V1- 20n) G7n34 )| 


n 0 -VI a07)). 
它 就 是 Ee ,这 样 就 证 明 了 系 2， 
从 证 明 中 可 以 看 出 ,对 INCa as) ,如 果 以 (mp) 为 参数 ， 


pb ,于 是 IN(pg ,p23A4) 可 以 写成 IN(p,pAB) ,相应 的 


矩 母 一 数 写 成 
ge(0) = explapBt1 - VT— 2607)!, 








= exp 


ii 的 


车 司 独立 ,& 一 IN(py p78) = 1,2,2 则 二 一 
> 所 一 IN( Zp 2 pl) IN ,pa AB)), 其 中 p= 
于 一 上 i= i= 


这 就 告诉 我 们 用 (jp ,PB) 作 为 参数 是 方便 的 ， 
现在 来 求 参数 下) 站 的 个 计量 , 设 Ts Tn 来 自 IN(p,p3/ 
A) ,这 个 样本 相应 的 均值 和 方差 是 
z=- la, 0- (rn a) 
i=1 . :=1 
从 矩 知 计 法 就 得 ( 风 (3.14) 式 ) 





A 
因此 得 
B= iT, A= /st = £87. (3.15) 
然而 从 (3.14) 第 二 组 等 式 可 以 看 到 
中 
即 


因此 可 以 导出 4 的 另 一 个 估计 量 
处 = (LP x7! 一 #1) ， 
下 面 我 们 将 看 到 , 它 正 是 最 大 似 然 估 讨 . 


样本 zi,，…,zn 的 联合 密度 是 pCri,…, za ;p44), 似 然 函 数 
LipsASTi nn Ts) = pTLA) , 它 就 是 


(让 <)( 革 Pee|- 志 训 全 全 | 





于 是 


" 21: 





了 


InL(pgsAstis'"s Tn) = 2 ln2r 十 性 lnA 一 这 In; 
1 一 让 








_ 和 A S1 《zi 一 
21 FAI Ti 

对 上 式 两 端 分 别 微 商 ,就 导出 亿 然 方程 

lnL(pgAszis st) Hn 工科 (zi— py 

= dx 2 2 EE 

dnL (pASTi sra) AM (Tp) A zi pk 
0 = 3 一 + 
上 # A =1 Ti ail 

Afnz- 2 1 nm — ne va 工 

-入 (3 Znp + pe + ng es 

= (nlF -££)). 
因此 解 得 最 大 似 然 估计 为 


R=， 计 = (i137 - za71) . (3.16) 
如 果 用 后 , 表示 天， 的 调和 平均 , 即 


-1 
b= (12D) 
或 
ph-1=1 > zt 
+ ni 
由 算术 平均 .调和 平均 不 等 式 知 道 
hn ， 
也 即 有 
hil 守 工 -1, 


而 4= (一 三 1) t, 它 具有 A 之 0 的 性 质 ,所 以 县 一 个 合 平 非 负 
要 求 的 估计 . 


4. 对 数 正 态 分 布 


随机 变量 w >D, 如 果 它 的 对 数 Inw 遵 愉 正 态 分 布 , 则 称 w 遵 


2 





从 对 数 正 态 分 布 .类 似 地 ,如 果 随 机 向 量 w 的 每 一 个 分 量 都 是 正 
的 ,各 自 取 对 数 后 形成 的 橱 机 向 量 mo 条 从 多 元 正 态 分 布 ， 地 称 mw 
遵从 对 数 正 态 分 布 . 

为 了 从 多 元 正 态 分 布 的 密度 导出 对 数 正 态 的 密度 ,我 们 先 证 
明 一 个 引 理 , 这 一 引 理 在 今后 有 关 分 布 的 推导 中 是 经 常 要 用 到 的 . 

引 理 4.1 假定 随机 向 重 z， 的 联合 密度 是 已 知 的 p(x)， 
户 (z) 在 区 域 D 上 不 为 0, 在 呈 以 外 均 为 0. 考 虑 x 的 函数 = 
gfz),y 的 取 值 范围 是 六 ,有 和 且 g(x) 是 DD 到 方 上 的 1-1 变换 ,x 
可 以 用 y 表示 , 即 有 反 函 数 工 =h(y), 当 g,h 可 微 ,而 且 偏 微 商 均 
连续 时 ,> 的 分 布 密 度 亿 y) 有 如 下 的 表达 式 : 

Fy) = plh(y))| (zly)|,y € 万， (4,1) 

其 中 J(z|y) 是 zz 对 y 的 雅 可 比 行列 式 , |J(x1y) | 表示 行 剂 式 的 
绝对 值 . F(y) 在 五 外 为 0. 

证 明 令 

yas 
To = | Se 
即 1(y) 是 集合 jy:y<<a|} 的 示 性 评 数 ,y 与 a 均 为 n 维 向 量 .于 是 
Pi< ao 的 ao) = Ply< a) 
= Plg(x) < a) 
= ple, za) dried 


EX) 
于 所 口 
= |…|rCgCz))e(z)dz， 


其 中 dz = dz1…dz;. 作 变数 替换 , 令 y=g(z), 则 有 工 = 卢 (9 )， 
yED ,于 是 上 式 右 端 积分 就 变 成 对 y 在 请 上 的 积分 . 即 有 


二 gcz)Dacz)dz = wpa rly) tay 
D 
-| Jotn le id dy 


+ 23 - 





这 就 证 明了 (4.1) 式 . 

这 一 引 理 告诉 我 们 求 随机 向 量 函 数 的 分 布 时 ,只 要 函数 满足 
引 理 的 条 伞 ,就 可 以 直接 写 出 随机 向 量 函 数 的 分 布 密度 ,关键 是 求 
出 站 (以 到 天 3 

现在 用 引 理 4.1 来 导出 对 数 正 态 分 布 的 密度 函数 . 

例 4.1 一 元 对 数 正 态 分 布 . 

设 一 Ne ,考虑 yy 二 ex 于 是 工 二 Iny. 很 明显 ,此 时 与 
引 理 4.1 i 

= (— oo， B= (0,%),h(y) = Iny， 


1 
J{zly) = Siny = y: 


因此 ,由 (4.1) 得 》 的 分 向 密度 六 





] -tiny-py 
ER cy ” 2>0 (04.2) 
0, 其 他 . 
例 4.2 多 元 对 数 正 态 分 布 . 
Xl 


设 关 一 从 (并 | | , 考 丰 二 ei 二 1,2,… ,nn, 于 


是 二 = Iay 此 时 与 引 理 4.1 中 相应 的 有 
D= RD = Rr,h(y) = lny, 
J(xz1y)= (TI»)” 

因此 ,由 (4. 中 得 了 的 分 为 


EE on 


0, . 其 他 . 
(4.3) 
由 于 对 数 正 态 分 布 已 有 较 长 的 历史 ,有 关 的 统计 性 质 和 应 用 
已 有 专门 的 著作 ,这 里 列举 一 些 重 要 的 性 质 并 给 出 简略 的 证 明 . 
四 414 
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假定 x ~N(p ,一 ),z=lny, 于 是 y 遵从 对 数 正 态 分布 , 记 为 
y 一 ACE, 学), 现 在 来 求 y 的 期 望 值 . 方 差 协 差 矩阵 等 统计 参数 . 
先 考虑 一 元 的 情形 ,再 考虑 多 元 的 情形 . 

1.y 一 入 (gs), 则 有 


I”- ep|“ 号 )， (4.4) 


Var(y) = [exp(2p + o2)][e” -1]. 
证 明 当 x 一 N(y,o?) 时 ， 


1 


oY 27 





= | 
Fe” = | ere atz 4 dx 
i ] 


= 1 | ea 2 ld 











oY 2 J 
. 122 1 下 2 
一 e+! | 。 of 
Fv 人 一 
= emp| oz + 去 co|， 


1 2 


而 y=e*, 因 此 Ey = Ee™=exp Mato |, 当 a=1 时 ,Ey= 





ep|p+ 守 |: 当 a=2 时 ， 
Ey: = expl2p + 2ca2| ， 
于 是 Var(y)= Ey?- (Ey)? =[expl2p + oi][e -1]. 
2., 一 (和 之 为 则 有 | 





| 二 EXP ] Pa 十 二 cj: 三 1 22," 
Var 和) 三 [expi2p + ga} J[e®s 一 了 ] ,5 一 荆 ,2， 


(4.5) 
这 从 人 4.4) 可 以 直接 导出 . 今 了 =lny 一 NO 了), 且 


Covly;,y;) 一 正 36 一 (Ey:) (Ey,) = Ee™® 一 (Ey: ) (Ey,). 


。25 - 


nr 


令 a=e;+ejire: 是 第 i 个 坐标 为 1, 其 余 坐 标 均 为 0 的 向 量 , 则 


Tit z=ax, 


BE 


-Ise 
其 中 = (x- 上 -Za) D1z-p 一 a)--a 2a 一 2P 于 是 
Eyy; = 也 er 


2) -$$ ap) -2 ] 








= exp|ap 十 $a Da 


= exp 








Pit ot 六 (ar + 0;) 
于 是 得 
Cov( yi,Y) = [exp 








|[e” -1]. 


(4.6) 
实际 上 ,从 求 Cov(y;,y) 的 表达 式 时 ,我 们 已 经 证 明了 如 下 的 
公式 


1 
t+ 方 (oa + 0;) 





E(I[%)= Ec” = explap+ a’ Da |， (4.7) 
共 (4.7) 式 可 以 求 出 的 各 阶 混合 乘积 矩 . 
正 的 随机 向 量 往 往 与 实际 问题 中 的 基 向 量 是 吻合 的 ,于 是 自 
然 要 问 :如 果 基 商量 w 是 遵从 对 数 正 态 分 布 , 风 想 应 于 上 的 成 分 
向 量 z 会 遵从 什么 样 的 分 布 ? 这 里 我 们 利用 $3 的 结论 来 导出 这 
一 分 布 , 下 一 章 我 们 将 用 另 一 种 方法 来 导出 这 一 分 布 . 
为 了 行文 方便 ,考虑 基 疝 量 


wn 


[4 | = 
Crt i)xt 


相应 的 成 分 向 量 
Tg 
Tl th 
erilya : "i 一 et 0,1,2,"*, 1, 
Tn 


由 于 zx; >0,1x=1, 拓 此 成 分 向 量 z 的 分 布 实际 上 由 其 中 个 分 
量 完全 决定 .为 了 方便 ,我 们 仍然 称 它 为 z 的 分 布 ,联合 分 布 密度 
是 指 后 = 个 分 量 zl ,……,zn 的 联合 分 布 . | 
当 es 之 ) 时 ,Inw~N(p, 光 ), 而 
Imnz = Inw — 1lnt, 

令 开 =(-1 了 ),y=Finx =Flnw-- 下 1lnt=Finw, 于 是 y 的 分 
布 密度 由 83 中 的 43.6) 式 给 出 ,因为 Inw 正 态 , Flnw. 是 Inw 的 线 
性 画 数 , 它 还 基 正 态 分 布 ,相应 的 密度 是 


(AF) ei 


| $F) By-Fe) ， (4.8) 
其 中 
. a 
Bn = (I oa | B= 1 2 这 
ll 一 玉 0 了 三 1 >, 1 。 
由 (4.8) 式 就 可 以 导出 zl,…,zxn 的 联合 密度 ,今后 (4.8) 式 的 密 
度 是 重要 的 ,进一步 的 说 明 在 下 一 章 展 开 . 


现在 用 (4.8) 导 zl1,…，zn 的 联合 密度 . 由 于 B 具有 人 性质 
是 1 二 克 -于 一 避 - 和 企 罗 - 贡 N1' 允 -二 =0, 分 块 后 就 有 








Bu BIs 1 Bi 1 + Br» 
0=B1= ( }- ， 
By Bj 'l1 B21 1 + B2 
即 
B14 = Bin=-Bnli,B»y= -Bnl1=1 Bl; 


=- 27 ， 


neh rhe tT i TE i EE ei EE WL TE I hal i PN i 


因此 得 


日 = Bi Bi 1 
一 1 号 1 1 好 1 
人 
末了 
Yi 二 lnzx; — Inzxo,i 一 1,2, :HH 
于 是 
Xi! + 一 工 
To 六 00 
1 -1 
一 1 十 -一 
1 一 To 2 并 0 
1 1 
二 站 .起 而 
= 全 x7!. 
t=0 


(4.9) 


而 y=Inzx; -Inzo, 写 成 向 量 时 , 即 为 y= Flnz, 用 引 理 4.1 就 得 


到 x1,… ,zs 的 联合 密度 是 


对 玫 1 _ , _ 
( 坊 ) [Bul3( TT zr )e 2 (Fne Fa) BunCFhr Fn) (4.10) 
. i= 


将 指数 上 二 次 型 整理 后 ,就 有 
《Flnz — Fy)Bu(Flnz - Flng) 
一 《lnz 一 ADFBiFCnr 一 lnw ) ， 


而 
F'BuF = uc —1) 
| Bu -Bn 
-By 1B 1|)° 


用 (4.9) 就 知道 FBnF=B, 这 样 可 以 将 (4,10) 改 写 为 


+28， 


er a en 


(Fe) 1 Ba (I zr)e de Pe (410) 
z= 个 


V2 
之 PDT = 1. 
这 就 是 x1，,… ,zn 的 联合 密度 ,其 中 
,DD By Br) 
B=- TY Ba Bl, 








iB | 的 值 可 以 证 明 它 就 是 (| 巡 |1 避 -11) “1, 这 一 结论 留 作 练 
习 . 


$5. 犹 氏 分 布 


成 分 数据 的 统计 分 析 中 另 一 类 重要 的 分 布 就 是 犹 氏 分 布 
《Dirichlet distribution) 及 其 推广 的 形式 . 狭 氏 分 布 与 贝 他 函数 、 仙 
马 函 数 有 密切 联系 , 它 可 以 看 成 基 允 元 的 贝 他 函数 ,也 可 以 很 自然 
的 从 伽 马 分 布 导出 .我 们 先 扼要 地 介绍 一 下 贝 他 函数 、 何 马 函 数 、 
伽 马 分 布 ,然后 引出 狱 氏 分 布 ， 

贝 他 函数 Bla ,6) 是 由 下 式 定 义 的 : 


1 : 
Bla,b) = ja — ildr,a > 0,6>0, (5.1) 


伽 马 函 数 (4) 是 由 下 式 定义 的 : 
r(a) = eterd,a > 0， 《5.2) 
它们 之 间 有 关系 式 
Bla,b) = LOLS) (5.3) 


Fla te) 
由 BCa,6) 可 以 引出 在 (0,1) 区 间 上 的 贝 他 分 布 , 若 z 的 分 布 
密度 为 下 述 前 数 ; 


1 -171 65- | . 
0 ， 其 他 . 
，29 。 


Te i 二 和 


则 称 x 遵从 贝 他 分 布 , 记 为 x 一 Bla,5),a 与 5 是 分 布 中 的 两 个 
参数 . 

由 您 马 函数 可 以 引 册 在 (0,ce) 上 的 伽 马 分 布 , 若 z 的 分 布 密 
度 为 下 述 晒 数 ; 


fr) -hr ‘oe ,zx>0, (5.5) 
. 0 ， ”其 他 . 
则 称 x 订 从 怖 马 分 布 , 记 作 I Y(tay5B), 其 中 4, 均 为 正 数 ,是 
分 布 的 两 个 参数 . 
狼 氏 分 布 可 以 看 成 是 贝 他 分 布 的 推广 , 它 可 以 由 侧 马 分 布 引 
导 而 得 . 
令 
再 (al yc) 
= | HA) De) dadr,, (5.6) 
Triold nn 11 ， i=1 
Da<l 
当 n==1 时 ,B(a1,a2) 就 是 (5.1) 式 的 由 他 阔 数 ,要 注意 (5.6) 式 
右 端 是 重 积 分 ,n= 1 时 就 是 (5.1) 式 右 端的 单 积分 . 
可 以 用 数学 归纳 法 直接 证 明 


n+1 nil 
Bla1sa2s ane) = TH roa) T(2a), (5.7) 

这 和 留 作 练 导 . 下 面 我 们 用 为 一 种 方法 证 明 这 一 等 式 , 这 一 证 明 与 成 
分 数据 能 发 生 内 在 的 联系 . 

假定 基 向 量 w = (wow ao) 中 各 个 分 芋 是 相互 独立 的 ; 
各 自 洲 从 情 蕊 分 布 , 参 数 有 不 相同 的 ,因而 不 要 求 是 同一 分 布 ， 见 
假定 

wi 一 Yassb) ,i = 0,1, ,mn 

且 wo;w1,"…;wn 相互 独立 .于 是 令 


t = Ds Fi = wi/t ,i = 0,1,2,." ,1 
=0 


i ep HI rE ER i eT dp 





基 向 量 w 相应 的 总 量 是 1 ,成 分 向 量 就 是 .现在 来 求 + 与 成 分 向 
量 z 的 分 布 .我 们 用 引 理 4.1 来 导出 上 与 z 的 联合 密度 ,确切 地 说 
就 是 1 ,xz1,… ,zn 的 联合 密度 .此 时 与 引 理 4.1 中 相应 的 各 个 量 
是 : 
D= Riri, 
BD = (zz >0,r>0,:= 1 Dx, < i|, 
i=1 
wi = tT = 1,2,. 7, 
we = t(1-— >)= 
由 于 ow; 是 相互 独立 的 ， 它们 的 联合 守 朗 是 
plwos swn) 三 (1[ i Fa 人 js， 
而 对 站,ziyyzn 的 雅 可 比 行列 式 为 


1- yz， 一 下 "ft 
i=1 


Jtw | t,x1," Ts) = 之 1 0 = 要， 


于 0 t 


用 引 理 4.1 就 得 1 的 联 会 寄 度 
F(t, XL, Ln) = tpl tro, Eris trn) 
| TT Ye x 
一 上 [1 Fa te) 'le 2 
(1 万 ， 
其 中 co = 1 了 zi. 于 是 由 x; = 1, 并 令 a = >) ai 后 ,就 得 
i i=0 1 


”于 好 ,一 1 . _ 
ft Ei Tn) -| “ 人 D, 
0 , 其 他 . 


(5.8) 
人 31 BJ] 


ET 





为 了 更 简明 突出 密度 晴 数 的 表达 式 , 今 后 对 密 雇 函数 上 只 写 出 它 的 
非 零 部 分 及 相应 的 区 域 ,于 是 (5.8) 式 可 写成 
EE 本 一 了 
Flt ri Tr) = ve wl PO’ (za sn) ED. 
将 f(t ,zz … ,Xn) 对 积分 ,利用 公式 


三 eseedz 一 La) 
0 . pe +» 


就 得 zi，……,z+ 的 联合 密度 为 
一 (Ge 2 (Tx ) (1 一 Dr) 
和 i=1 


万 (zzn) 一 


> 0 2 Da < (5.9) 


由 于 (5.9) 是 分 布 密度 ,密度 在 非 0 值 区 域 上 的 积分 是 1 ,这样 击 
(5.9) 式 就 得 到 


[RE 
Dilan Tr(a) 
Sl 人 


这 实际 上 就 是 (45.7), 只 要 比较 一 下 (5.6) 的 积分 与 上 式 左 端的 积 
分 就 可 亿 看 出 . 

不 仅 如 此 ,我 们 以 (zi …, zs) 的 联合 密度 可 以 看 出 上 与 
2z0…3zn 基 相 互 独立 的 ,而且 上 的 分 布 是 yfea ,6), 和 将 以 上 结论 用 
定理 的 形式 给 一 个 总 结 . 

定理 $.1 假定 wo;w,…,w, 相互 独立 , 且 

wi ~ Ytaisb) i =0,1,,n, 
则 基 向 量 w = (ooyol, ,wm) 相 应 的 总 量 与 成 分 有 如 下 的 性 质 . 

1) 总 量 与 成 分 y 相互 独立 ; 


(2)t~ylas5b), 其 中 a = Das; 


7, 








(3) 成 分 z 的 分 布 密度 是 (5S.9) 式 给 出 的 独 玫 分 布 D(a0,al， 
+ ,A }. 
狄 氏 分 布 (5 .9) 很 明显 是 由 他 分 布 的 多 元 情形 ， 它 是 成 分 数据 
的 一 个 重要 的 分 布 娄 型 .下 面 我 们 来 计算 狭 氏 分 布 的 各 阶 矩 ， 
假定 z =《zovziyzo) 是 一 成 分 疝 量 , 它 的 分 布 是 狭 氏 分 
布 Daoyai， ar), 即 密度 为 





r(Da;) 问 Ei >0,7= 0,1 ss 
= [a 4 (5.10) 
rc) 之 1 一 


注意 (5. 9) 与 (5. 10) 是 同一 个 内 容 , 只 是 形式 不 同 ,(5.10) 的 方便 
之 处 是 它 对 于 成 分 x 的 各 个 分 量 是 对 称 的 ,形式 上 更 为 简明 .- 仿 
a 一 (aosa1* G6) 后 ,(5.10) 还 可 以 写成 
rlle) 下 
I ra) i=0 


lr >0Olz = 1. (5.11) 


今 
a ri L 
E(Tz)= -| (TT a) ddz,, 
i=0 0,31 人 =] Hrs) i=0 
利用 (5， 7) 就 可 得 右 端 的 积分 信 ， 记 和 2 = (qorats' san) 后 ,就 有 


a (ai + ar) TELay) 
PE(Is)= [ 立 了 (ai 人 + L'a) 


i 二 
因此 , 取 a; =1, 就 得 一 阶 矩 yai = 2, 就 得 二 阶 矩 . 也 即 有 : 
(DEx;=P ,i=0,1,. ,ns 
(Er = tp Te i 0 
_ ata:+1) 
(3)Ex?= T+ [NE 


(4)Var(xi) = =ala~a)}/(laY (Lar1)},i=0,1,.…,n 


+ 33* 


pp 


(5) 当 i; 时 ， 
CovAxis Ti) =— ans/l(la (ha + 1)]. 
值得 注意 的 是 这 种 求 各 阶 年 的 方法 是 一 个 标准 的 方法 , 它 利 用 密 
上 度 中 的 参数 和 密度 在 全 空间 上 积分 为 1, 不 需 计 算 积 分 可 以 直接 
表示 出 来 .我 们 分 别 用 其 马 分 布 及 二 项 分 布 为 例 说 明 这 一 点 . 
车 随机 变量 x 的 密度 为 1 


起 有 2 e ,>0. 
于 是 由 密度 积分 为 1 ,就 得 等 式 
te dz 一 D2,, >0,5>0. 
要 求 x 的 & 阶 原点 矩 时 ,有 
-BE [YY 
Fxrt = FE le-dz. 
右 端 积分 只 是 将 参数 a 用 a + 来 代 , 从 上 述 积 分 等 式 ,马上 就 知 
道 它 的 值 是 二 3 站 ,这 样 就 求 出 Ext 一 202+ 1 (+k 一 
用 一 个 臣子 来 表示 时 ， 就 有 


za 





Ex*= FF 人 | tre le rdx 
_ mm Tletk) 1 | 
Tla) pe wl +i-1). 


车 x 遵从 二 项 分 布 , 其 密度 为 
jwa-。 )r =0,1,: 
于 是 有 熟知 的 等 式 
> nn 开 一 上 一 _ #4 
> pa P= (0+1- 0" =1. 
要 求 x 的 产 阶 原点 定 , 就 有 
更 二 m 六 "在 
Ex 2* ( pe 0) 


这 时 似乎 没有 等 式 可 用 ,但 注意 到 
Ezr(z -1)- Da -Dpa bn 
= Ds 一 D 人 2 pa 一 人 


= za - Do 总 人 Jet -or 


= n(n - 1)8, 

实际 上 用 了 对 参数 n 一 2 的 密度 之 和 为 1 的 等 式 . 可 以 家 出 
Erftz-1ifz-2) 等 各 阶 匀 矩 , 从 阶 匀 和 矩 再 导出 原点 矩 和 中 心 定 . 

以 上 这 两 个 例子 很 有 代表 性 ,但 矩 的 公式 不 用 密度 的 性 质 , 也 
早 己 知 道 , 因 此 往往 忽略 了 这 一 标准 的 利用 密 虐 的 方法 , 求 狐 氏 分 
布 的 条 ,实际 上 是 用 了 这 一 方法 ,今后 会 常用 这 一 标准 方法 ,到 时 
就 不 细 写 了 . 

由 于 贝 他 函数 与 犹 氏 分 布 的 联系 ,因此 从 贝 他 分 布 的 性 质 可 
以 导出 一 些 相应 的 狂 氏 分 布 的 性 质 , 下 面 举例 来 给 以 说 明 . 

设 工 一 Bla,5), 导 之 的 密度 为 

(te # —_ ryil>r>0a>0,6>0, 








取 y= 在 过 ,于 是 ? 在 (0,ce ) 上 有 密度 ,注意 到 
1l-rz+tzr -上 
| dy = (zd 0a 
日 | 
1 + 3 三 1 一 了 
因此 y 的 密度 就 是 


(Ba iy + yt, y>0. 
这 一 分 布 用 到 (a,58) 来 表示 , 称 为 逆风 他 分 布 (inverse beta) . 注 
意 , 它 不 是 贝 他 分 布 变量 之 道 的 分 布 ， 
与 这 一 个 相 类 似 , 我 们 可 以 知道 ,车 随机 变量 y~ JB(a,b)， 
则 令 工 = 二 yA1+ yy) 后 ,就 知道 x ~B(a,4&). 


TE TE TE ED Ltt 





于 是 可 以 将 这 个 结果 推广 到 狱 氏 分 布 . 设 zl1,…:,ze 遵从 狭 
氏 分 布 Ptaoalyar) 考 碟 


工 





和 
1 一 oa 
i=] 
于 是 同样 可 以 求 得 雅 可 比 为 
(x1 Tn | y1 三 (1 十 Dy) ™. 


代入 分 布 密度 ,就 得 yj，,…, y 的 联合 密度 为 下 式 中 的 记 (y1，…， 
J ): | 


入 一 


因此 


y > 0,7 = 1,2,°,n 


称 为 道 狄 氏 分 布 , 记 为 IDtao,al，……an) .同样 要 注意 送 指 的 是 什 
么 样 的 变换 


习 题 一 
1. 直接 验证 : 当 荆 ji 存在 时 ,只 要 民 -1! 存 在 , 则 下 式 就 是 工 的 道 阵 民 -1， 
即 有 
Di- 2 3 3 | 
之 Za 0 0 








+ 360+ 


+ Dea, -0 
其 中 





> 了 22" = 27» - - 之 aa 2 2 12" 
2. 证 明 习题 1 后 ,回答 下 述 问题 : 
(人 证明 中 是 否 需 机 假定 卫 是 一 正定 阵 ? 或 要 假定 书 是 对 称 阵 ? 
(b) 如 果 上 题 中 忆 -1 存 在 , 工 xs 有 道 , 则 卫 -1 分 块 写 出 的 公式 是 什么 ? 


3. 已 知人 ) 是 联合 正 态 分布 N(x, 卫 ), 其 中 


本 


车 已 知 = 的 边缘 分 布 为 N(a,A), 且 丈 知 yz 的 条 件 分 布 为 N(b,B), 用 
a ,及 ,日 写 出 zx 对 3y 的 条 件 分 布 密度 . 

4. 如 果 已 知 y 一 NN(y, 驯 ),y 是 mx1 的 随机 变量 , 求 z= Fy 的 分 布 密 
度 , 其 中 下 = (IJ,-1 一 1) 是 (mm 一 1) x mm 的 纵 阵 . 





5. 已 知 二 次 型 Q = Das 5 将 Q 写成 z'Br 时 , 求 B 的 表达 


式 (即将 互 用 ws 表示 出 来 ) 并 考虑 以 下 问题: 

(a)B 的 秩 是 儿 少 ? 

(b)B1=0 是 否 成 立 ? 

6. 证 明 下 述 结 论 :车 是 nxn 的 非 负 定 矩阵 ,并 且 B 的 牧 kB = 
n 一 1,; 则 Bi=0 的 充分 必要 条 件 是 :存在 己 >0 快 吾 = 荆 1- 
wl 
和 了 

7. 在 上 一 是 中, 条件 不 变 ,a 是 任 一 给 定 的 非 替身 量 , 则 Ba =0 的 充 要 
条 件 是 什么 ? 

vw-111»! - 

8. 甘 B=!1- TI 和， 召 是 #x# 的 矩阵 ,分 块 写 出 也 = 

(a se) 


Bu Bzll 
百 一 1] 1 
9. 用 数学 归纳 法 证 明 ;:fai; 0,i=1,2,…,n) 


.求证 [Bu1= (| (LD 1)) 


= 37 - 





全 (Ha) -> Ye! der Mr 
Ee Po) 


zl 





th 


10. 利用 习题 9 的 结论 ， 证 要 :fai >0,7=1,2,"… ,nn) 


[| 


ln 


其 中 


11. 将 习题 9 一 10 的 结论 推广 到 zx; 是 正定 和 矩阵 的 情形 ,相应 的 卫 函数 
也 作 进一步 的 推广 . . 

12. 将 习题 10 中 的 所 如 4;) 必 为 f{ 避 zx) ,积分 区 域 改 为 全 空间 ,是 否 
还 能 保持 相应 的 结论 ? 


附录 ”反正 态 分 布 及 其 推广 


反正 态 分 布 及 其 推广 越 来 越 受 到 统计 界 的 关注 ,一 个 重要 的 
头 因 是 它 有 广泛 的 应 用 背景 .从 1957 年 文献 [3] 发 表 后 ,有 很 长 一 
段 时 间 没 人 注意 这 一 分 布 ,到 了 70 年 代 , 逐 浙 有 人 关注 、 发 现 这 类 
分 布 与 许多 领域 的 现象 有 关 , 这 些 内 容 汇 集 在 文献 [4] 的 第 一 章 
中 ,文献 [5] 第 一 次 将 这 类 分 布 与 成 分 数据 相 联 系 .我 们 这 个 附录 
只 介绍 与 成 分 数据 有 关 的 这 些 内 容 . 

现在 考虑 $1,…, 相互 独立 ,但 分 布 不 相同 ,& 一 IN( jp ,pi/ 
8) ,参数 8 是 相同 的 .从 $ 3 我 们 知道 & 的 密度 可 以 写成 


_3_8 
pi Fe ze 2 tt — pi), 


38， 





因此 ， Eye 的 联合 密度 是 


站 _3 _ et py 
人 到 站 we 综合 ， em 
i ,i 一 1 .2 好， 
又 已 知 ( 昂 $3 定理 3.2 的 系 2)s = 二 吝 +…+ 友 的 分 布 是 


IN( vy fis S178) ,因此 * 的 密度 是 : 
i iT . 


此 + 性 se ， (A.2) 


Tt . 


其 中 


考虑 成 分 向 是 
Xi AS 上 2 
于 是 (x1,x2,…, zs-1,5) 的 联合 分 布 密度 从 (A.1) 得 到 : 
驻 Lj . ss 一 刘 
(2) Ta) de , (A.3) 


{= 





5 >0,x: 一 1.2， ,ns Dx 一 工 . 
i=1 
稍 加 整理 ,就 得 上 式 为 | 


(f(s) Pe), CA 


s > Or > 0 = 1,2, ,nz = 1. 
i=1 


上 式 对 :积分 ,就 可 以 导出 成 分 (zx,…, xz, -i) 的 联合 密度 ,注意 
到 (A.4) 式 对 s 积分 的 值 与 贝 塞 尔 函 数 有 关 , 所 以 讨论 赵 来 比较 
复杂 . 男 一 种 考虑 是 看 z1,…, zx。 1 对 的 条 件 密度 ,将 (A.4) 式 
除 以 (A.2) 式 ,就 得 条 和 件 密 度 ,这 一 密度 也 可 以 导出 另 一 类 成 分 数 
据 的 分 布 ,注意 此 时 * 是 常数 ,相应 的 密度 形式 比较 简单 , 即 为 


”39 。 





(1T Je (A.5) 
jt 


Ti 0,i = 12y Hy Dz = 1, 
i=} 


其 中 c 是 与 及 a; 有 关 的 一 个 正 风化 常数 . 
类 似 的 方法 ,也 可 雇 从 道 反正 态 分 布 导出 成 分 数据 的 分 布 类 
型 . 
反正 态 分 布 的 推广 ,就 是 文献 [4] 的 内 容 , 推 广 的 一 般 形式 是 
密度 为 
p EF 


lr et 
plzriasab) = rle 2( tix), 工 祈 0， 


a 
2K,(V ab) 
(A.6) 
其 中 a>0,5>0,aEER,K,(:) 是 中 塞 尔 函 数 .从 (A.6) 就 知 齐 有 
karti), 2K,(v ab) 
| ee dr = (Bb/a)2 
这 一 会 式 可 以 求 出 广义 反正 态 分 布 随机 变量 各 阶 年 的 表达 式 . 
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第 二 章 ” 单 形 上 的 分 布 
$ 1. 成 分 与 总 重 的 独立 性 


基 向 量 w 分 解 为 总 量 * 与 成 分 x ,x 只 是 反映 了 w 的 各 个 分 
量 在 总 量 * 中 所 占 的 比例 , 当 x 与 1 独立 时 xz 的 分 布 与 的 值 无 
关 , 这 样 对 = 单独 进行 统计 分 析 是 有 意义 的 ;如 果 z 与 + 不 独立 ， 
则 对 x 单独 进行 分 析 的 意义 就 大 为 减弱 , 例如 ,矿石 样品 中 金属 
含量 的 百分比 随 着 矿石 的 重量 而 变化 ,这 样 的 百分比 数据 就 难以 
单独 分 析 ; 又 如 ,人 的 区 站 中 各 类 细胞 所 含 的 比例 若 随 血 消 的 多 少 
而 改变 , 则 在 验 血 时 就 难以 从 抽 到 的 很 少 -- 部 分 血液 来 断定 体内 
的 情况 . 这些 实 际 例子 都 假定 了 成 分 z 与 总 量 : 是 相互 独立 的 , 因 
此 在 数学 上 讨论 什么 时 候 w 才 具 有 这 种 性 质 ,这 是 有 意义 的 . 

假定 基 向 量 w>0,o = (wo,w1，,…,w。》 , 它 的 联合 分 布 密度 
是 plw)= plwo, wi") ,于 是 


bb 
一 多， = 证， 
i=0 


x = (ro Ki", Ta), 
已 知 w 的 密度 后 ,可 以 很 方便 导出 上 与 区， 的 联合 密度 .为 
了 方便 ,以 后 我 们 说 成 分 向 量 z 的 密度 就 是 指 它 个 分 量 工 1 ,…， 


zn 的 联合 密度 ,注意 ro = 1- Dz 
引 理 1.1 人 根 定 = (wo ws wn) 的 联合 密度 是 p (wo， 
ol en) ; 则 相应 的 :与 x 的 联合 密度 是 
"p(s(1— Di) ,te es). (1.1) 
证 明 = 的 区 域 是 及 + :4 与 x1,… ,zs 的 变化 区 域 是 万 = 
- 41， 





上 0 2 < 1 ,而 变换 


wi = trioi = 12, nsw00 = £(1— > 中 是 1- [变换 .上 一 章 
第 五 节 中 已 求 得 
Jo 1 1 

因此 {1.1) 式 就 是 1 ,zx 的 联合 密度 

现在 ,由 引 理 1.1 导出 基 向 量 w 的 密 庶 使 相应 的 上 与 + 独立 
的 充 要 条 件 . 

定理 1.1 假定 基 向 时 。 的 联合 密度 是 函 教 志 (woyoi,…， 
ws); 则 有 :z 与 x 独立 的 充 要 条 件 是 存在 函数 f(:) 使 得 

fc 2 wi) 


plcwos co1y… ,Co ) 一 一 一 一 一 疡 (oo an) (1.2) 


对 任 一 <c>0 都 成 立 . 
证 明 充分 性 . 若 (1.2) 式 成 立 ,由 引 理 1.1 得 到 :与 = 的 联 
合 密度 为 - 


2*p{ tros ttl Era) 


三 牛 ES plo se) 


很 明显 ,* 与 x 是 相互 独立 的 . 
必要 性 ,. 若 xz 与 1 独立 ,相应 的 密度 分 别 用 乒 [ zl ,与 
F(t) 表示 .由 引 理 1.1 知道 应 有 关系 式 
tpltros tr tra) = FA(CT1, ,Tn), 
即 为 
在 (Eroytrly tra) 一 (zs 


用 wi 一 让 代 人 上 和 式 ,得 


+ 4 


TY WME: ee ens 











p(wor ws Wn) = 一 -2 (名 …, 名 ) 
ar) 
于 是 有 :Yec >0， 
f{c Zo) wl ww 
plcwos cal cn ) = [ 急 ， ,区 】 
cf or ) 
i=0 





f{c. a ) 
pw, wn) 
cf( | ww ) 
这 就 证 明了 定 划 1.1. 

实际 上 ,不 论 基 向 量 w 相应 的 # 与 x 是 否 独 立 , 只 要 知道 了 wm 


的 密度 p(wo,wi,…, wo,) ,由 引 理 1.1 立即 可 知 成 分 z 的 分 布 窗 
谋 是 





fpros te tn)de. (1.3) 
例 1.1 假定 w 的 各 个 分 量 独立 ,各 自 遵从 广义 的 个 马 分 布 ， 
即 
ai ~ as = 0,1 nn 
ai > 0,6 > 0,N > 0. 
于 是 


1 站 天 a ey a 


* 虽 于 “ 


用 (1.3) 就 得 w 相应 的 成 分 向 量 的 分 布 密度 为 
| rp (TE a a < 1)e -tt Da de 


5 一 种 
前 


了 一 由 








其 中 a = 六 oa,. 利 用 公式 
i=0 
| tesa = 了 te) 
[i 
就 得 rz, 天 的 联合 密度 为 
ore 开交 ez op 1) (Pa)™, (1.4) 


注意 


机 
如 二 Dai, xo =1— Zz, 
i= 旋 =1 


Xi > 0,7 = 1,2, Dr < 


当 b=1,A=1,i=0,1,…,n 时 ， 它 就 是 狼 氏 分 布 . 

然而 不 论 w 相应 的 上 是 否 与 x 独立 ,x 的 边缘 分 布 总 是 有 的 ， 
记 为 疡 (zz 于 是 对 x 配 上 一 个 独立 的 正和 随机 变量 1 ,就 可 
导出 另 一 个 基 向 量 的 分 布 ,而 这 个 基 问 量 相应 的 + 与 x 是 相互 独 
立 的 .这 就 告诉 我 们 , 想 寻 找 成 分 向 量 的 分 布 类 时 ,只 需 考 上 碟 上 与 
式 独立 的 情形 就 可 以 了 ,从 引 理 1.1 和 定理 1,1 就 知道 ,z 与 x 独 
立时 ,w 的 密度 与 1,z 的 各 自 的 密度 ,hh 有 关系 式 
fll'w) co 
Ge 各 一 区 让 





pltwos ol, ,on ) 一 
即 有 


lInp{tw) = Ing(lw) + mh (从 ,… 侣 外 


“ow 


很 明显 ,上 式 右 端 第 二 项 , 把 它 奢 成 wo。…，mw 的 函数 时 , 它 是 





wo,…, 的 齐 0 次 的 函数 ,而 右 端 第 一 项 只 是 tu 的 函数 ,x 的 
密度 是 由 第 二 项 决定 的 .这 就 使 我 们 从 wo,w1,…,w, 的 齐 0 次 函 
数 中 去 如家 相 应 的 分布 


很 明显 ， w ii i,j = =0,1,.…,n 的 函数 是 wg, wl w 


的 齐 0 次 尊 数 . A 最 简单 的 函数 是 多 项 式 ， 然而 以 兰 ,作为 自 变 


量 的 多 项 式 实际 上 不 可 能 形成 正 随 机 向 县 的 分 布 密 度 ， 若 与 指 
数 函 数 = 1“ 一 起 可 以 形成 一 种 混合 分 布 , 这 一 讨论 可 参看 本 章 的 


习题 . 另 一 种 考虑 是 把 于 的 对 数 作为 自 变量 , 考 卡 





nh (党 …… 黎 | 是 这 此 In 空 的 多 项 式 ,最 简单 的 多 项 式 是 一 次 


的 或 二 次 的 ,这 两 种 情 阅 正好 对 应 于 犹 氏 分 布 与 加 法 逐 辑 正 态 分 
布 ,现在 来 说 明 这 一 点 . 


1. mh {下 ,…, 近 = Dn 
注意 到 In (w/w ) = tn — be ,所 以 稍 加 整理 就 可 将 
Pasin ， 写成 Bl - 一 了)iney, 于 是 当 Ing (lw)= 一 1w 时 ,mw 
的 密度 就 是 
(正史 De™, w>0, 


其 中 ec 是 一 个 常数 ， 它 相应 的 成 分 = 的 分 布 密度 ,正好 是 狄 氏 分 
布 .如 果 Ing(lw) 二 一 (1w)’, 于 是 w 的 分 布 密度 就 是 


Ch (六 le -lw)》 ， > 人 0 C1.5) 


其 中 c, 也 是 一 个 党 数 ， 它 相 应 的 成 分 < 的 分 布 密度 是 狄 氏 分 布 ， 
这 一 类 分 布 的 一 般 性 质 , 我 们 在 本 章 83 详细 讨论 . 


2 ia 中， .区 j= Bs — Dinw, + pr (ns < 


"5 





稍 加 整理 ,上 式 右 端 可 以 写成 向 量 inw 的 一 次 型 与 二 次 型 之 和 , 即 
有 如 下 的 形式 ; 
(a 一 no + (nw) Ainw. 

由 习题 一 中 的 5- 一 8 题 ,我 们 知道 此 时 A 具有 性 质 4 1=0. 如 果 有 A 
的 秩 是 n, 且 一 和 太守 0, 则 存在 正定 阵 沁 使 A 表 成 

_ 及 = [wr 加 VD /AD 1] /2 
这 样 当 a =0 时 ,只 要 相应 的 上 3 独立 的 分 布 密度 是 (2)， 
w 相应 的 联合 密度 是 


K(1w)g(1w)( IT aa 。 > 0， 
其 中 四 
D = St 关 S11 11 5 /LD 1, 
KK 是 一 个 常数 . 它 相 应 的 成 分 向 量 z 的 分 布 密度 是 





(SED DI) dm ae 
X= (x0 Ti, Tn) Xi > 0,i = 0,1,.…,n, 
其 中 


= 3 四 S17 il Sl. 
这 正 是 加 法 多 辑 正 态 分 布 . 
这 就 告诉 我 们 , 狱 氏 分 布 与 加 法 还 辑 正 态 分 布 在 一 定 意 义 下 
是 成 分 向 量 的 分 布 类 中 最 简单 的 两 种 分 布 ， 
更 广泛 一 些 的 讨论 是 涉及 基 向 量 w 相应 的 大 小 G{w) 与 形状 
ze(w) 的 独立 性 .在 这 里 我 们 纵 出 一 个 有 关 大 小 的 一 个 重要 的 结论 . 
引 理 1.20 设 Z>0,7>0:, 它 们 都 是 下 的 随机 变量 , 且 x/y 


1) 和 参看 文献 [2]p.291. 


a 








荆 与 zx 独立 ,只 与 独立 , 则 随机 变量 ,xz /y 一 定 是 退化 的 . 
证 明 zzxy 与 x 独立 ,zyvy 与 y 独立 ,并 且 rr,y 均 为 正 随 机 
变量 ， 因此 有 : 
nz - Iny 网 与 1nz 独立 ,又 与 Iny 独立 ， 
这 就 得 到 相应 的 特征 函数 
Fe 站 iny 一 Feitiny—Inetinr) 
= Fe hn pe 
同样 地 有 
所 eatnr = fev-tny) Feihy 
因此 
Ee nr RettnzpJ |] Yi€ RI 


这 就 知道 他 =c 概率 为 1 地 成 立 , 即 等 是 退化 的 . 

有 了 引 理 1.2, 我 们 可 以 得 到 有 关 形 状 和 大 小 独立 性 方面 的 
一 个 重要 的 结论 ,这 就 是 

定理 1.2? 设 w 是正 的 随机 疝 量 , G;(w) 是 大 小 ,相应 的 形 
状 向 量 是 xz; (fw),i== 1,2. 如果 zj(w) 与 Gifo) 独 立 , ifo) 又 与 
Gzs( 旬 ) 独 立 , 则 Gotw)/Gi(w) 一 定 是 退化 的 . 

证 明 我 们 只 要 证 明 G2tw)/G1(w) 是 xz1(w) 的 函数 , 则 由 
引 理 1.2, 从 zi(w) 与 G;(w),i=1,2 各 自 的 独立 性 ,知道 条 件 满 
中 ,就 得 所 要 的 结论 . 今 

Galzilw)) = Glw /Gu)) = Gtw) /Gi ), 
这 就 证 明了 G2(w)/G1(w) 是 zi(w) 的 孙 数 . 

定理 1.2 告诉 我 们 ,与 形状 向 量 独立 的 大 小 一 定 是 线性 相关 
的 ,它们 的 比值 是 一 个 常数 .给 定 基 疝 量 w 之 后 ,成 分 xz 与 总 量 + 
是 一 对 形状 与 大 小 的 随机 变量 .定理 1.2 告诉 我 们 成 分 zx 车 与 总 
量 : 相互 独立 , 则 z 不 会 与 别 的 大 小 独立 ,除非 它 是 上 的 倍数 .从 
证 明 中 还 可 以 看 出 形状 向 量 彼此 是 可 以 互相 表示 的 { 也 可 以 参见 
第 一 章 的 定理 2.1) ,这 告诉 我 们 只 要 有 一 个 形状 向 量 zi1(&) 与 相 
应 的 太 小 Gikte) 独 立 , 则 所 有 的 形状 向 量 都 与 G1(w) 独 立 . 
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近年 来 ,对 大 小 .形状 等 统计 量 有 了 进一步 的 扩展 ,这 些 已 超 
越 了 本 书 的 范围 ,有 兴趣 的 读者 可 以 参阅 文献 [2]. 
现在 再 来 讨论 成 分 向 量 x 与 : 的 关系 ,x 与 + 不 独立 时 会 是 
什么 情况 呢 ? 能 否 给 出 条 件 分 布 与 条 件 密 度 ? 我 们 以 基 疝 重 ww 
是 对 数 正 态 的 情形 为 例 , 来 作 一 点 说 明 . 
xt 服从 对 数 正 态 分 布 , 即 tne 一 NIn 8) 此 时 的 
联合 密度 为 
#+1 EL 
(Ft) oI) $m -Hane -| 
于 是 由 引 理 1.1 知道 ,成 分 向 量 z 与 总 量 : 的 联合 密度 为 
m+l | ， 
( 志 ) [ol (TT zr )exp|- Q| ， 
其 中 
Q = (nz + nt ~ pn (nz + Tinz 一 A). 


令 1=int, 于 是 di = 二 dz, 因此 z 与 ! 的 联合 密度 为 


1 n+l _1 对 -1 1 
( 坊 ) 1al 2(1 =) exp|- 二 Qi| 
其 中 
Qi = (nr +1i -pn (nr +1i— x) 
将 忆 | 略 加 整理 ,写成 | 的 平方 和 的 形式 , 即 
Qi= (NDE+2 EN nz pp) 
+ (lnr — pa) nnr — p) 
1 (nz ~ p) 1]? 
= (L071 |, 本 
， -11111271 
+ (lnr -~ py) [a 一 One -2)， 
于 是 明显 看 出 ,对 /! 积分 后 ,就 得 * 的 联合 分 布 密 度 为 


( 读 儿 9100 9D)#( 评 lz) ie ， 


PA ee ee er es rh 





其 中 
-11TO-1 
Qnr [0 全 je 内 


于 是 就 求 得 ! 对 x 的 条 件 密度 
2 1 LD ne-p) 

plilz) = (Ed le 于 (1.7) 
也 即 :对 z 的 条 件 密度 是 正 态 分 布 ,相应 的 条 和 件 期 望 与 条 件 方 差 
是 

Elilzx} =— (107 1)! L107 (nz — ££), 
(1.8) 
{vcs, = {10 1)-1. 

值得 注意 的 是 (1.8) 中 条 件 期 望 与 x 的 值 有 关 , 而 条 件 方差 却 与 
工 无 关 . 当 基 向 量 w 的 分 量 相 互 独 立时 ,lnw 的 各 分 恒 也 相互 独 
立 , 员 是 一 对 鳃 矩阵 ,0 是 一 对 角 阵 , 它 相 应 的 主 对 角 元 紊 是 各 
自 的 方差 的 倒数 ,通常 也 称 为 精度 ,于 是 (1.8) 式 的 条 件 期 望 就 可 
以 看 成 一 (lnz 一 p) 按 Ino 的 精度 进行 加 权 平 均 , 它 的 统计 意义 是 
很 明显 的 . 

{1.8) 式 还 告诉 我 们 , 基 向 量 w 服从 对 数 正 态 分 布 时 ,总 量 z 
与 成 分 向 量 x+ 是 不 可 能 独立 的 ,因为 Eii| zx} 随 zz 而 变 . 尽 管 我 们 
求 得 了 i 对 上 的 条 件 分 布 是 正 态 ,但 我 们 还 未 能 求 出 7 的 边缘 分 
布 . 


- 人 $2. 逻辑 正 态 分 布 


退 辑 正 态 分 布 类 是 Aitchison 书 中 主要 的 内 容 , 它 有 许多 优良 
的 性 质 , 也 可 以 从 不 同 的 方式 引导 出 来 .这 一 节 我 们 将 论述 各 种 等 
价 的 定 祥 ,然后 讨论 有 关 的 性 质 . 

定义 2.1 假定 成 分 向 量 zx = (zo,zl,…,zo) 的 函数 和 = 


nz sil 服从 * 维 正 态 分 布 N(p, 台 ), 则 称 成 分 zz 服 


二 





从 加 法 还 辑 正 态 分 布 . 
这 一 名 称 的 由 来 是 因 它 与 逻辑 变换 有 关 . 对 成 分 向 量 x ,将 它 


用 In 字 ,=1,2, 变换 为 y 后 ,y 的 变化 范围 是 ( - ce ,co )， 
将 过; 用 »; 表示 时 ,就 有 


x; = / (+ De), i 二 1,2,."*,n， 


z0=(1+ Pe) ! 


逻辑 变换 是 英文 logit 的 音译 是 通过 对 ri; 取 对 数 {log 一 六) 这 样 
变换 得 来 的 . 
定 巡 2.2 假定 成 分 向 量 x = (xzoyzi 2 的 函数 人 = 


必 二 1,2,…,n 服从 正 态 分 布 Nm , 卫 ) , 则 称 成 分 二 


(2.1) 





ln 
一 Ti 
服从 乘法 逻辑 正太 分布. 

此 时 的 zx; 用 y 来 表示 时 ,有 关系 式 


=es/TTG +e)， i 二 ,2 
i=1 


Xo 三 [I + 的) 
比较 (2.1) (2.2) 表 达 式 中 zi 的 分 母 ,一 个 是 连 加 的 形式 ,一 个 是 
连 蒋 的 形式 ,所 以 一 个 称 为 加 法 泛 辑 正 态 分 布 , 一 个 称 为 乘法 逻辑 
正 态 分 布 . 
现在 来 引 人 分 割 逻辑 正 态 分 布 .车 对 成 分 向 量 z 进行 分 割 ， 
分 为 段 , 则 


1- 2) 
j=1 


(2.2) 


TH) | Ri 


-下 到 
(a+)xl 








TILEY nn 


令 志 =Tzrro 于 是 
EE S50 - 





z 十 十 不 一 之 五 = 1， 
所 以 了 向量 1 = (8,…, 克 ) 也 是 一 个 成 分 向 量 , 记 
se) = TT) = rota ,0 = 1,2,°",k, 
于 是 st 3 就 是 了 分割 为 z0D，…… 工 (昌之 后 相应 的 子 戌 分 . 
一 个 天 分 割 相应 地 有 
A 下 所 统 ? 

这 点 + 1 个 向 量 , 每 个 向 量 都 是 一 个 成 分 向 最 ,各 自 的 分 布 都 可 以 
由 对 数 比 来 确定 ,于 是 有 

定义 2.3 假定 成 分 向 便 x 对 给 定 的 大 分割, 相应 于 :， 
3D 25000: 陋 工 ,5 0 ;50 和) 分 别 作 加 法 或 彝 法 逮 辑 变 横 后 , 相 
应 的 向 量 记 为 mw,yD，… 3 如果 这 些 jy ,ya),…, ytw 的 联合 
分 布 是正 态 , 则 称 成 分 x 服从 分 着 逻辑 正 态 分 布 . 

现在 由 这 些 定义 来 导出 相应 的 xz 的 分 布 密度 . 

1. 加 法 逐 辑 正 态 分 布 的 密度 

已 知 y ~ Np, 沁 ) ,于 是 y 的 密度 西数 是 


( 堪 ) 1p|- (>- 一 Ap 
由 于 1 . 


用 向 量 写 出 就 得 
23=(-1 Telinr，lnz = (nzolnzl, nr》 


已 知 雅 可 比 
J(y|zx)= Uz7', 
于 是 z 的 分 布 密度 是 
( 志 站 Eis)y'ele ea 


= $1 “ 








其 中 
Q=(Fnr-p (Finr -pF= (1 1,). 
由 于 
— 1 
五 = | 7 | (FF’) t= (1,+11’)!, 
于 是 FE (CL +11)-!1= 了 ,因而 记 F+ 0=F (FF ) ! 之 后 ， 
Q =(Flnz - FE (Finr - FEF*p) 
=(nr - Fru) FY p(nr - Ftp). 





注意 到 
-1 -1 -1 
BF >， F=| ,|2 (1 I) 
YD 
三 aa Ds F 
它 具 有 性 质 


FY FI-FY D0-0, 
再 注意 到 F" 是 满 列 秩 的 算 阵 , 于 是 FF 守 1F 的 秩 是 ,从 上 一 章 
的 习题 就 知道 存在 正定 阵 (2 使 
FoF= 0 01110 /TQ tl. 
这 就 与 我 们 前 面 用 其 他 方式 导出 的 分 布 相同 . 
2. 乘法 逮 辑 正 态 分 布 的 密度 
此 时 已 知 多 一 Na 二) 的 密度 晃 数 是 


1 _ 
2 | exp - 方 (y -1) > ‘(yp 








(去 ) 





1) F “有 定义 ,我 们 这 里 十 不 引 人 人 定义, 也 不 去 证 阴 FF(FF")"! 就 是 下 *. 


"3. 





可 比 行列 式 





J(y|zi ovz)= 工 加 1 | 


=T[ zi， 
于 是 柔 法 逻辑 正 态 分 布 的 密度 为 
_ 工 _ 
> | (Tl zx,) ‘ep|- 去 Q|， 
下 一 自 





(去 ) 
V2 
x > 0,7 = 0,1,.,n, x0 = 1- Dr, (2.4) 
其 中 
QQ = 2 {lnr 一 In{1 一 Dx,)- wm) 
x (na ~ In(1- Pa)- py), 
o 是 忆 -! 中 第 (; 7) 位 置 的 元 素 .很 明显 ,这 一 分 布 密度 不 是 取 对 
数 后 能 化 为 lnz 的 一 次 型 或 二 次 型 的 通 数 了 . 
3. 分 割 返 辑 正 态 分 布 的 密度 | 
这 里 以 二 分 割 , 三 分 割 为 例 , 写 出 相应 的 分 布 密度 ,一 般 的 情 
形 留 给 读者 自己 写 出 . 先 看 简单 的 二 分 割 的 情形 . 
将 成 分 向 景 = 分 为 二 段 x = 人 | ,at 
(< lz na 
te = Vx) 3 = Ta) xe) = rota!, «= 1,2, 
由 于 ti+ 12 一 1 三 此 考虑 一 个 变量 t1 就 够 了 ; 记 £1 为 is 相应 
的 对 数 比 分 别 用 yaa =1,2 表示 , 即 


“了 - 
TD (xor rls Cn-1) ?2) 一 (Ca se + + 


53 * 





ft 
Tn,—l 号 1n,—1 
1 i lt 1 
Yi 一 tn 一 ,]n | | » » 
了 0 310 510 
Tn +l 工 要 32n,-1 
202) In ! » 二 | | 2 ,In 用 
] 直 ] 320 #20 


yD :902) 的 联合 密度 是 NIPr ,二 ), 即 密度 函数 是 
(去 ) 5 | 3)e4e, (2.6) 


Yr 

YR-. 

YI2) 

将 ,yn ,yw 分 别 用 (2.5) 相 应 的 + 及 zi; 代入 (2.6), 注 意 到 相 
应 的 雅 可 比 行列 式 





其 中 


Q = [Cy% ,yy 0) -0 





m1™1 #71 


J (yy yo) |z, St1)» 5(2}) = GH Ha)" 
了 


于 是 从 (2.6) 就 可 以 得 1 ,50)， st 的 联合 密度 . 
将 成 分 向 量 x 分 为 三 段 ， 





TD | 1 
{3 13 
此 时 有 
fo = Lz), sfaj 一 za(lzen)! = 了 (下 = 1,2,3, 
t1] 
用 i 表示 向 量 |t2| ,而 122=ti+t2+ t= 4x = 二 ,因此 上 也 是 
f3 








= 要 和“ 


一 个 成 分 向 量 .分 别 用 yD Y2) ty) 表示 £50)r5(2)s503) 所 形 
成 的 对 数 比 的 向 量 , 和 上 面 二 分 割 鲜 情形 相似 ,可 以 从 y, yin， 
yyy09) 的 联合 密度 为 正 态 NCg, 富 ) ,导出 0550 的 联 
合 密度 ,注意 这 时 相应 的 雅 可 比 行列 式 是 

J (Ys Ys 902) 3203)| £9501) 1502)» 803) ) 


其 中 5 ,7 =0,1,2,-… ,no 一 15a 二 4,2,3 是 s04) 相 应 的 各 个 分 量 . 

从 上 面 的 讨论 就 可 以 导出 一 般 分 割 的 情形 ,这 一 讨论 留 作 
习题 . 

由 于 加 法 亚 辑 正 态 分 布 具有 相当 的 代表 性 ,从 定义 2.1 看 出 ， 
这 一 定义 对 成 分 zx 的 各 个 分 量 不 具有 对 称 性 ,其 中 zo 占有 特殊 
地 位 ,在 讨论 各 种 性 质 时 不 方便 ,为 此 我 们 引出 等 性 的 定义 ,然后 
利用 等 价 的 定义 可 以 导出 各 种 统计 性 质 .我 们 用 定理 的 形式 给 出 
等 价 的 定义 . . 

定理 2.1 成 分 向 量 x 遵从 加 法 导 辑 正 态 分 布 的 充分 必要 条 
件 是 :x 的 任 一 组 对 数 对 比 都 服从 正 态 分 布 .， 

证 明 充分 性 是 明显 的 . 因为 y = (1 1,). lnr， 是 一 组 


Cant x1 


特殊 的 对 数 对 比 ,所 以 y 服从 正 态 分 布 .现在 来 证 必要 性 , 由 于 全 
一 全 
部 对 比 的 系数 是 形成 一 个 4 维 子 空间 ,而 让 = | 7 | em 本 是 


这 个 子 空间 的 一 组 基 , 因 此 任意 一 组 对 比 的 系数 符 阵 4 , 它 的 各 
列 都 是 对 比 系数 向 量 , 均 可 表示 为 下 的 线性 组 合 , 即 存在 BB 使 有 A 
= FB. 因 此 A’Inz= BF inr= 了 ,而 是正 态 分 布 , 它 的 任 一 
组 线性 阔 数 都 是 正 态 分 布 ,这 就 证 明了 必 变 性 . 

定理 2.1 告诉 我 们 ,加 法 还 辑 正 态 分 布 可 以 用 zx 的 任 一 组 对 
数 对 比 都 服从 正 态 分 布 来 刻 划 , 也 可 以 用 它 作 为 定 多 .这 可 以 与 正 
春分 布 的 定义 相 类 比 :y 是 pp x1 的 随机 向 量 ,y 的 任 一 线性 王 数 
a3 服从 正 态 , 则 称 y 服从 多 元 正 态 分 布 .下 面 我 们 利用 定理 2.1 

”5 有， 


ee Ee 


来 证 明 加 法 迎 辑 正 坊 分 布 的 一 些 性 质 ， 
很 定 成 分 向 量 z:(a + 1) x 1 服从 加 法 还 加 正 态 分 布 , 则 = 
具有 如 下 的 性 质 ; 
CD 的 全 部 对 数 比 in 委 i 天 j。 1.j=0.1.…,n | 是 联合 
正 态 分 布 . 


因为 每 一 个 对 教 比 虽 二 = nz - lnz) 者 是 x 的 一 个 对 数 对 
比 , 所 以 全 部 对 数 比 是 一 组 特殊 的 对 数 对 比 ， 根据 定理 2.1, 室 们 
服从 正 态 分 布 . 

(1) 


(2) z 的 任 一 & 分割 z= :相应 的 子 成 分 scpy，…, scx) 








Tk) 

是 各 自 遵从 加 法 殖 辑 正 态 分 布 ,它们 的 对 数 对 比 都 遵从 正 态 分 布 . 
由 于 seo 的 任意 一 组 对 数 对 比 都 是 x 的 一 组 对 数 对 比 , 根 据 

定理 2.1 就 知道 应 是 正 态 分 布 , 因 此 sr 的 分 布 是 加 法 还 辑 正 态 














分 布 . 对 Sr ys st 都 选 定 各 自 的 对 数 对 比 A1 Insoy: 
A'ilnsee) 4 于 是 有 
A31lnst] 43lnzrtp :9 . 
。 。 D 上 内 > 0 
: 过 一 - : : Inx 
4kInsto】 【Atnrdb 0 0 Ai: 


它们 仍然 是 z 的 一 组 对 数 对 比 , 由 定理 2.1 知道 它们 的 联合 分 布 
是 正 态 分 布 ， 

当然 ,我 们 要 注意 多 元 正 态 分 布 的 任 一 组 线性 函数 仍然 是 正 
态 分 布 ,这 包含 了 协 方差 矩阵 可 以 是 退化 的 情形 ,上面 的 结论 中 也 
是 如 此 ,这 一 点 在 应 用 时 需要 注意 . 

现在 来 讨论 如 和 何 描述 加 法 多 辑 正 态 分 布 参数 以 及 相关 的 统计 
性 质 ， 

设 rz =(zoyziyza) 是 成 分 向 量 , 记 
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{Inz) = (lnzolnzllnz)， 
于 是 (2.1) 相 应 的 变换 也 就 是 
y= (-1 I)nz, {2.7). 
2 的 分 布 是 正 态 N (pg, 之). 描述 向 量 x 的 均值 自然 是 (Erz) = 
(Exro, Ezri,"' Er, ) ,由 于 14x =1 总 成 立 , 震 炒 1 上 x =1 自然 也 或 
立 .y 的 期 望 值 由 正 态 分 布 的 性 质 知道 Ey= pg, 于 是 由 (2.7) 式 得 
2 二 = Ey=(-—1 和 Elnz . (2.8) 
从 玉 Inz 去 求 出 Ex 是 可 以 的 ,但 它 与 从 (2.1) 式 直接 求 出 的 Ex 
是 否 一 样 ? 从 (2.1) 式 得 


Ex; =Eex/ (1+ 20). i = 1,2,.…,n, 
(2.9) 
Exo =E(1+ Pe) 
然而 ， 如 果 要 讨论 的 工 的 性 质 可 以 用 y 的 性 质 来 描述 的 话 ， 

我 们 就 只 需 处 理 正 态 总 笨 , 情 况 就 简单 得 多 .这 一 方面 ,成 分 数据 
旦 现 出 它 的 特性 ,在 期 望 值 向 量 和 协 方 养 阵 上 有 明显 的 差别 . 对 成 
分 向 量 <, 它 的 期 望 值 Ez 自然 是 统计 中 的 重要 参数 向 量 , 它 反 摧 
-了 各 个 指标 变量 的 平均 百分比 ,并 且 一 定 满足 其 和 为 1, 即 1'Ex = 
i1. 而 二 的 方差 协 方差 矩阵 Var(z)? 却 是 一 定 退 化 的 ,并 且 遇 于 
2 D02zi 一 1 ,这样 zx; 与 zi 之 间 往 往 呈 现 负 相 关 . 然 而 在 实际 
癌 题 中 ,例如 在 一 些 地 质 勘 探 资 料 中 , 某 些 金属 元 素 有 伴生 现象 ， 
如 果 钢 的 含 基 增 加 ,伴随 着 金 的 含量 也 增加 ,它们 之 间 呈 现 正 相关 
性 .很 可 能 在 成 分 向 醒 中 可 以 分 成 若干 组 ,各 组 之 间 是 负 相 关 , 而 
组 内 却 有 正 相 关 . 这 一 类 统计 性 质 的 探讨 是 重要 的 .加 法 逻辑 正 态 
分 布 的 特点 是 将 z 的 分 析 转 化 为 y= 二 ( 一 1 7T)inz 的 分 析 ,y 是 
正 态 分 布 , 但 是 y 的 协 方差 矩阵 在 多 大 程度 上 反映 了 x 协 方 差 矩 
阵 的 性 质 ,如 何 反 映 ,这 些 都 成 了 成 分 数据 统计 分 析 中 的 重要 问 
是 .很 明显 ,y 的 协 方差 阵 与 tnz 的 协 方 差 阵 有 密切 的 联系 ,因为 
?是 Inz 的 线性 函数 .但 是 Inz 的 协 方差 阵 与 x 的 协 方差 阵 有 证 
么 关系 ,这 就 比较 复杂 了 .因此 对 于 加 法 逻辑 正 态 分 布 来 说 , 如果 


我 们 对 成 分 向 量 z 的 特性 的 了 解 是 由 inz 来 反映 的 ,那么 我 们 关 
注 的 是 Inz 的 协 方 差 阵 与 y 的 协 方差 阵 的 关系 ,这 给 统计 分 析 带 
来 很 多 方便 .下面 我 们 就 给 出 反映 这 些 关系 的 表达 式 . 

从 加 法 逻辑 正 态 分 布 的 性 质 可 以 知道 ,下 列 各 个 Inx 的 线性 
函数 都 是 正 态 分 布 ,它们 的 协 方差 矩阵 与 lnx 的 协 方差 算 阵 有 窑 
切 的 赚 系 . 这些 沙 数 是 

LL (LT 1) 和 
1 -7 
oa 一 《 “n+l 11 J ng 
ti =Inz; ~ Inz;, ij = 0,1, ,7. 
设 Inz 的 协 方差 矩阵 为 V,Y= 《00)i,j=0,1,…,n, 则 有 
. _1 
DD) =Varly) = (-1 Dv| |. 


= Val$) = (ni) (hn it) 
={Var(t;)) = (Vart nw; — bx;)) 


rn 
Cntl)x(nt+1) 


Gatien 
=(v + vi — 2 ). 
(2.10) 
记 DLV) 为 V 的 主 对 负 元 素 组 成 的 对 角 和 矩阵 , 则 在 (2.10) 中 的 工 
可 以 写成 
T= DVAL +11iD(V) -2V. 
《2.10) 中 的 之 , 卫 , 工 是 可 以 相互 表示 的 ,例如 
-2 入 =(-1 DT| | 
nn ni+l 
类 似 的 关系 式 就 可 以 逐一 号 出 ,这 就 贸 给 读者 自己 当 作 练习 . 
以 上 这 些 在 文献 [1j 中 是 很 强调 的 ,一 些 统 计 性 质 可 以 用 证， 
本 或 本 来 表示 ,看 哪 一 个 方便 ,而 且 它 们 签 此 均 可 以 转换 .从 数据 


* SS 


-2F = (oa -一 1 )T{ ma -—i 1 





Ts 


A 





处 理 来 看 ,用 Y 表示 是 最 方便 的 ,因为 从 成 分 样本 的 数据 很 容易 
求 出 V; 另 一 方面 ,从 加 水 逻辑 正 态 分 布 的 定义 知道 ,许多 统计 分 
白痢 涉及 纪 , 因 此 沁 与 V 的 关系 是 重要 的 .实际 上 (2.10) 已 给 出 


-Cr pv | 


这 是 今后 会 常常 用 到 的 . (2.10) 是 将 于,T, 了 用 V 表示 ,任何 一 
个 可 以 用 其 他 三 个 来 表示 ,这 些 关 系 式 ,读者 自己 去 推导 ,或 参见 
文献 [1j 中 的 内 容 ,我们 这 里 就 不 一 一 写 出 了 . 
对 于 加 法 逻辑 正 态 分 布 ,讨论 成 分 应 量 的 相关 性 的 结 梅 主要 
是 讨论 它 的 对 数 问 量 in 的 关系 , 它 有 以 下 几 种 不 同 的 相关 性 ， 
定 久 2.4 成 分 向 量 xz 称 为 对 数 比 不 相关 ,如 果 


Cov(In 委 ,mn 到}=0， (2.,11) 
二 并} 


对 i,j ,点 ,[ 四 数 不 同 时 都 成 立 . 

成 分 向 量 x 称 为 对 数 对 比 不 相关 ,如 果 对 任何 两 个 正 交 的 对 
比 系 数 向 量 a 与 5 ,a inz 与 5 Inzx 总 不 相关 , 即 a’1=0,5’1=0 
且 a 厂 =0, 则 有 . 

Covta lnz ,blnr) = 0. {2.12) 

成 分 和 启 量 x 的 对 数 对 比 的 系数 向量 a 是 单位 向 量 时 , 即 

2 了 二 0 且 a'a =1, 对 数 对 比 的 方差 都 相等 , 即 
Varla Iinr)=e {2.13) 
对 ea1=0,ae=1 成 立 . 则 称 x 的 对 数 对 比 各 向 同性 ， 

上 述 三 种 不 同 的 措 述 成 分 向 量 z 的 相关 性 的 概念 是 程度 不 
同 的 相关 , 它们 之 间 有 一 定 的 联系 ,又 有 差别 .现在 来 讨论 这 种 联 
系 ， 

注意 到 对 数 比 Int zsZzi) 是 lnzxi -Inzxj; 它 是 一 个 对 数 对 比 ， 
而 当 ;7 ,二 ,! 都 不 相同 时 ,n(xz; /zj) 与 In(zp/xi) 的 对 比 系数 一 
定 是 正 交 的 .因此 成 分 向 量 x 是 对 数 对 比 不 相关 时 ,一 定 是 对 数 
比 不 相关 的 .然而 ,由 对 数 比 不 相关 却 不 能 导出 对 数 对 比 不 相关 ， 
这 很 容易 举 出 例子 来 说 明 ， 


i 





各 向 同 伺 与 对 数 对 比 有 什么 关系 呢 ? 用 成 分 向 量 x 的 对 数 


的 协 差 阵 VW 来 表示 ,就 可 以 上 明了. 
引 理 2.1 设 成 分 向 量 x 是 对 数 比 不 相关 的 , 当 # 实 4 时 则 
一 定 有 
> = D(a) + bt’ - 1), (2,14) 
其 中 
al 0 
D(a) = 这 . 
0 “a, 


证 明 记 引 =(o5) 后 ,就 有 在 i 去 时 ， 
oi =Cov(Inz ~ Inzxo lnzr; ~ inxwo) 


=Cov(lnz; ~ lnzoslnr; ~ nz: +lnz — Inxo) 
=Cov[in 至 ,三 )+ Cov[In 至 ,in 于) 
To 本 本 To 区 于 
对 任 一 成立 ,选用 天 Di 上 式 右 映 第 一 项 为 0, 这 就 得 
5 三 gas 因此 可 得 非 对 角 元 素 全 都 相等 ,这 就 证 明了 (2.14). 


引 理 2.2 成 分 向 量 zx 各 向 同性 的 充分 必要 条 件 是 :存在 常 
数 ce 使 





1 
r= ec{I il) {2.15) 





证 明 当 a 1=0 时 ,a= (A- F111 )e 会 P,a, 因 此 
n 

aa=1 时 自然 有 a P.a=aP,.a=il. 

充分 性 : 

Varta nx) =Varta Py nz) = aTa = aP’, VPa 

=a Pa= ce. 

必要 性 :由 于 栈 = PVP, ,因此 厂 1= 必 ,因此 1 是 械 的 特征 

向 量 , 相 应 的 特征 值 是 0. 又 





- - 
aIa_ .ala 
二 四 一 TIHI >， 
gna=] 性 过 aa=】 世人 好 
=0 21=0 


” G0 = 


因此 工 的 其 余 的 非 零 特 征 根 均 相 等 旦 为 c, 因 此 有 正 交 阵 {1G 1) 使 

















1 
T=(G Dan | | 
P= ccG'+OIL EG 1=0GG=1,. 
由 : 
1 G 1 
hu= (6G 1 ) 1 1 |=cc'+ “1, 
= /i “1 
ntl /iri ” 


就 得 





r= eGG’ = (I- i) 
定理 2.2 成 分 向 量 x 各 向 同性 与 对 数 对 比 不 相关 是 等 价 
的 . 
证 明 由 引 理 2.2, 从 x 各 向 同性 导出 对 数 对 比 不 相关 是 显 
然 的 ,现在 来 证 明 它 的 送 . 
对 数 对 比 不 相关 时 一 定 有 对 数 比 不 相关 ,因此 由 引 理 2.1 知 


道 ， 
此 1 0 | 
0 an 


oF = pi +t a0 = 1,2,%,n. 
于 是 有 ao 一 五 ,ai;= a; 一 了, 今 


> = Da to -1), Dla) = 





或 写成 


a + ap =Var(In 到)- Cov{m 亚 ,到 | 
十 To AD 
= Cov[m 玛 + hn 人 ,n+ 口 王 上 
.证 站 机 T} To 


当 1i,j, 上 不 相等 ,i ,j,k 都 大 于 0 时 ,由 对 数 比 不 相关 ,得 


ai oo =Cov(In 于 ,mn 至)+ Cov(m 本 ,In 汝 ] 
TE Li 六 过 站 


El + 





-Cov(in 到 ,mn 至)+ ao0， 


二 
因此 得 ;到达 ， 
i -cor(m 至 , 王 广 Cov(m 到 ,之 ) 
= Covtlnzi — inzsy， 一 2tnzi + lnzi + Inzrt) 
二 0， 
于 是 cz =…=an=a* 即 卫 =ef+eao 41 ,而 已 知 


四 1 ， 
r= (I 2 111)2 (1 zr) 








因此 


也 即 x 是 各 向 同性 的 . 
§3. 广义 狄 氏 分 布 


在 第 一 章 ,我 们 证 明了 下 述 结果 : 若 基 向 量 的 分 量 相互 独立 ， 
各 自 革 从 其 马 分 布 , 则 它 所 相应 的 成 分 向 量 就 如 从 狄 氏 分 布 .是 否 
狭 氏 分 布 往往 是 与 基 向 量 各 分 量 的 独立 性 有 关 呢 ? 我 们 将 会 看 到 
并 非 如 此 ,即使 基 向 量 的 各 分 量 之 间 并 不 独立 ,可 以 是 正 相 关 ,也 
可 以 是 负 相 美 ,然而 ,它们 所 相应 的 成 分 向 重 仍然 是 服从 犹 氏 分 
布 .进一步 分 析 还 可 以 看 到 ,如 果 基 向 量 的 分 布 是 一 类 很 广泛 的 分 
布 时 , 它 可 以 导出 比 狭 氏 分 布 更 广泛 的 一 类 成 分 分 布 ,我 们 称 它们 
为 广义 狼 氏 分 布 .这 一 节 主 要 是 导出 这 些 分 布 密度 . 

在 本 章 呈 1 的 便 1.1 中 已 经 给 出 了 由 广义 仙 马 分 布 导 出 的 成 
分 分 布 t1.4), 它 的 一 个 特殊 情形 就 是 狄 氏 分 布 .现在 考虑 一 类 更 
广泛 的 分 布 , 先 引用 一 个 积分 公式 ,这 个 公式 在 讨论 分 布 时 起 着 重 
要 的 作用 ,我 们 用 一 条 引 理 来 手 述 ,以 便 今后 不 断 地 引用 它 . 

引 理 3.1 设 xz) 是 一 元 非 负 可 测 函 数 , 它 使 下 述 积分 的 右 
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TH he ti Me ae A 


端 有 意义 ,于 是 就 有 下 列 公式 ; 
| ( [x TUr( > x;) drodriedz, 
= i 二 0 


四 十 二 


]Tr(a) 
_ 了 ep， 1f(2)dt, (3.1) 


其 中 


三 一 yao. 
工 一 血 
证 明 注意 到 (3.1) 左 端 被 积 函 数 是 非 负 的 ,因此 积分 有 意 
义 . 作 变换 ; 
t = Dz,, 
i=0 
Mi 一 并 过 !, 二 1,2,°" ,ns 
于 是 记 xz = ol, 也 一 《9412 后 ， 
一 二 2 并， 
zo =i(1— >)»). 
因此 雅 可 比 行列 式 (参看 本 章 定理 1.1 的 证 明 ) 
J(x|y,t)= £™ » 
Ri (yi yast): t >0, i > 0, > < 中 ， 
于 是 (3.1) 中 左 闪 积分 


[ (1 | x (Pa)drodrr -dz。 


= | (0 Da ) gyndys] ede 


"63: 


已 知 上 式 右 端 第 一 个 积分 为 


Tl ra) 
rt( 2 a) 
于 是 引 理 得 证 . 


不 难看 出 ,(3.1) 中 积分 的 值 只 依赖 于 单 积分 | ze-LF(adt ， 
只 要 这 个 单 积分 值 有 限 , 记 它 为 (a;f) ,于 是 从 (3.1) 式 就 知道 


Te TD Ta Ps) 63.2) 
Treo i=0 i=0 .| 
就 是 R:+1 上 的 密度 函数 ,这 就 是 说 ,(3.2) 可 以 作为 一 类 基 向 量 
的 联合 密度 . 而 且 从 引 理 3.1 马上 可 以 看 出 ,如 果 基 向 量 w= 
《aoywl wa】 的 联合 密度 是 (3.2) 的 话 , 那 么 它 所 相应 的 成 分 . 
向 量 与 总 量 一 定 相互 独立 ,并 且 成 分 向 量 遵从 狄 兵 分 布 .很 明显 ， 
f=e 时 (ai 户 =Pa), 引 理 给 出 的 结论 ,就 是 由 独立 的 
仇 马 分 布 导出 相应 的 狄 氏 分 布 ， 
从 (3.2) 的 函数 形式 还 可 以 看 出 ,选择 用 ) 就 相当 于 选择 了 
总 量 上 的 密度 ,因为 总 量 t 的 密度 就 基 


1 - 
Fra lr(zy, :> 0. {3.3) 


现在 我 们 可 以 从 (3,2) 的 密度 ,导出 基 向 量 各 分 量 之 间 并 不 独 
立 , 但 它 相应 的 成 分 向 量 依然 是 狄 氏 分 布 . 


例 3.1 选 六 ti=e 7 bx>0 是 已 知 常数 .此 时 


至 


em 
了 (ai; 门 = | rle dt = 2 
于 是 用 w= (wo, wi，… ,wa》 表 示 基 向 其 , 它 相 应 的 (3.2) 密 


度 函 数 为 





Tab _ (让 el )e (Day ， 


wi >0, = 0,1,.…,n. (3.4) 
(3.4) 式 的 w; 之 间 是 不 独立 的 ,利用 (3.4) 式 对 参数 ai >>0,5 之 0 
都 是 密度 这 一 性 质 ,或 利用 公式 (3.1) ,都 可 以 求 出 基 向 量 w; 之 间 
的 混合 矩 , 得 到 








_ sr(a) -Dance De) aa 
r(g)Ire, ,| (UH jo dowd 
orla) Pr(2 LH ra) reao + 3 
r(#)ree 一 
T(r + 


r{(g)ra + 1)T(ao) 











1 Eum = i G35) 
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于 是 ,可 以 求 得 wi 上 与 witi 隆 六) 的 协 方差 
Cov{ ww; , ow; ) = Fw; 一 (Ew ){ Fw;) 











其 中 
Q - or( 生 (2 二 人- (a 上 Dr (es + !)] . 
因此 ww 与 不 相关 , 正 相 关 或 负 相 关 分 别 由 有 @ 的 值 是 0, 是 正 还 
是 负 而 定 . 很 明显 , 当 a 与 5 的 值 适当 选取 时 ,就 可 以 出 现 正 . 负 ， 
或 为 0 的 已 值 . 下 面 我 们 用 数字 来 说 明 这 一 点 : 
当 5=1 时， 
Q =aT(a}T(la +2)- (a +I){T(la+ DF 
=aa + DT (at+1)alr(a)]? 
=0. 
当 忆 =2 时 ， 
Q -or(a/)T (+1)- (e+DIP(2 


-本 [( 人 Dr 二 有 


对 于 a=1 时 , Q = (rt()) -2= 也 -2 <0, 实际 上 只 要 


0<a<2,QQ 均 小 于 人 0, 此 时 wi 与 w; 负 相 关 ， 
当 6b= 志 时 ， 
Q=alT(2a)T(2a +4) - (at+1)fT2a + 2)]? 
=[T(2a)] [2a2{2a + 1)(2a + 2)(2a + 3) 
- Cat 1l)4a’(2a +17?2] 








=[T(2a)] 24a2(a + 1)(2a + 1)(2a +3-2a—1) 
=8azfa +1)(2a + 1)IT(2a)}?* > 0, 
对 于 a>0,mi 与 w 总 是 正 相 关 . 
眠 这 个 例子 可 以 看 出 犹 氏 分 布 能 反 野 基 向 量 内 部 相关 时 ,成 
分 向 量 之 间 的 联系 ,不 限于 基 向 量 各 分 量 彼 此 独立 . 
现在 来 考虑 较 一 般 的 情形 ,导出 广义 的 狄 氏 分 布 . 
例 3.2 假定 已 知 及 《ao yo 是 wo,… ;wr 的 齐 * 次 函 
数 , 即 等 式 
(人 0 
对 *z>0 均 成 立 ,并且 
| (TT os eS goodordw, < %, 


+ i=0 
RL 


记 上 述 积 分 值 为 c(a;Q),a=(ao,a1,… ,an】, 于 是 


cla; zcaio) (1I ] oF 7 ) e Qtoo oo au > 0,i 一 0,1,.…,n 


(3.6) 
就 是 尺 :+1 上 的 一 个 密度 函数 . 
如 果 基 向 量 w= (wo,…', wn) 遵从 密度 (3.6), 则 成 分 向 量 
工 二 (zo,T1,"" Tn) 与 总 晤 1 的 联合 密度 为 


z=] 


1 者 
Were 
z0 二 工 一 Dlx, 好 一 Dla, 

i=!1 Cht 


se>0 zx>0 ii Da>0 | (3.7) 
和 
于 是 将 13.7) 对 上 积分 后 就 得 成 分 向 量 的 联合 密度 为 
[全 1 一 1 三 一 上 下 
err male )(1- 3 2 x [Q(zo0, Tl Ta) 


(3.8) 
+: 67 





这 一 密度 称 为 广义 犹 氏 分 布 . 
从 (3.8) 式 可 以 看 出 ,即使 s=1, 此 时 窗 度 为 


(3.9) 
只 有 当 


Q(zro, TL" ,Tn) 一 3 = 1 
时 ,人 3.9) 才 是 犹 氏 分 布 . 


很 明显 ,选择 不 同 的 齐 次 函数 QQ ,就 会 导出 不 同 的 广义 狂 氏 
分 布 , 如 取 


. Qo , wn) 三 Yat, 
i=0D 
(3.9) 式 就 导出 本 章 例 1,1 的 分 布 . 
尽管 (3.8) 式 中 有 未 知 的 有 Q, 但 参数 形成 的 常数 项 


(Lela;Q)]+! 的 值 依赖 于 向 量 as 与 Q 的 形式 ,重要 的 


是 c(a;Q) 相 应 的 积分 能 否 表 示 出 来 ,也 就 是 说 基 疝 量 w 的 联合 
密度 中 的 常数 是 否 完 全 能 用 参数 表示 清楚 .然而 有 意思 的 是 ,即使 
我 们 不 知道 c(a: 久 ?的 值 , 只 要 基 向 是 w 遵 兴 密度 (3.6) ,wi 的 各 
阶 混合 和 矩 仍 可 液 用 c (ua; 有 @) 的 值 表 示 , 这 是 标准 的 求 矩 方法 又 一 
次 取得 成 功 的 例子 . 
设 包 = (wo; wl, oo 的 联合 密度 是 
zo (Te)e oe, wi >0, i=0,1,",n. 
于 是 
下 1 和 
a(1[) -tar | (1 os 站 )e Qjwo" do, 


cia +r; 
cla;Q) ” 


其 中 
. k 一 《下 0 下 1 ky). 
-如果 w; 是 彼此 独立 的 ,cta;Q@) 就 是 一 些 密度 中 常数 项 莱 
积 , 它 很 方便 就 可 以 求 出 ,所 以 从 独立 的 w; 导出 相应 的 成 分 分 布 
是 不 困难 的 .下 面 的 几 个 例子 将 进一步 说 明 这 一 点 . 
例 3,3 假定 基 向 量 w; 相互 独立 , 均 遵 从 司马 分 布 ,但 参数 
均 不 相同 ,(wo，…,o) 的 联合 密度 为 


(Tas )e wi > 0,i = 0,1,2,.." ,7. 


i=D 





(3.10}) 
此 时 从 例 3.2 就 知道 , 它 所 相应 的 成 分 向 量 x = (zx0,x1，…， 
z,) 的 分 布 是 (参看 (3.9) 式 ) 
rd I 3 ， 。 
一 一 全 一 一 [Lz1)( 2 2) ", (3.11) 
TI Pa i= 恬 i=0 
i=0 
其 中 


rog=1-— Sz,, a 一 Za. 
当 A 多 相同 时 ,(3.11) 就 成 为 狄 氏 分 布 . 
容易 看 出 , 当 基 向 量 的 wm; 相互 独立 ,各 自 遵 从 道 傅 马 分 布 时 ， 
也 可 以 导出 类 似 的 结论 ,这 一 内 容留 作 习 题 . 
例 3.4 假定 基 向 量 w= (oo,owl，p……en 的 联合 分 布 密度 为 
(TT radr reat (Te + eo), 
= i=0 i=0 
(3.12) 
其 中 
a 一 Da,, a >0, i=0,1,-.…,n,bt>0. 
很 明显 ,w; 之 间 蚌 不 独立 的 ,然而 它 相 应 的 成 分 向 量 的 分 布依 然 
» 人 =- 


是 犹 氏 分 布 . 

很 容易 看 出 ,此 时 总 量 + 与 成 分 向量 zx 是 相互 独立 的 ,t 的 分 
布 是 贝 他 分 布 .实际 上 ,不 独立 的 基 向 量 的 分 量 , 它 个 的 分 布 类 型 
虽然 不 同 ,但 往往 仍 可 以 导出 相应 的 成 分 向 量 x 的 分 布 是 狄 氏 分 
布 .我 们 在 习题 中 留 下 其 他 的 例子 ,在 正文 中 就 不 一 一 提 及 了 . 

从 上 面 这 些 例子 可 以 看 出 其 向 量 的 什么 特性 会 导出 成 分 商量 
的 分 布 是 狭 氏 分 布 .我 们 就 以 例 3.3 和 3.4 的 情 沉 来 分 析 一 下 ， 

例 3.3 中 ,各 个 基 分 量 w; 是 相互 独立 的 ,然而 参数 4; 是 否 相 
同 ,决定 了 它们 的 成 分 向 量 是 不 是 独 氏 分 布 . 例 3.4 中 尽管 基 向 量 
分 量 之 间 并 不 独立 ,但 是 它 相应 的 成 分 向 量 仍 然 遵 从 狭 开 分 布 . 另 
一 方面 ,从 例 3.3 可 以 看 出 , 基 商 量 独 立时 , 它 相应 的 成 分 向 量 z 
是 和 否 服从 狄 氏 分 布 取 决 于 参数 4;, 参 数 Xi 是 一 个 尺度 参数 , 当 wi 
的 度量 单位 发 生变 化 时 ,A 的 值 就 会 改变 ,适当 调整 尺度 单位 ,就 
可 以 使 4; 的 值 彼 此 相 辣 ,相应 的 成 分 向 量 就 是 狂 氏 分 布 . 从 例 
3.4 可 以 看 出 ,尽管 本 向 量 的 w; 被 此 是 不 独立 的 ,a; 也 可 以 不 相 


同 ,但 只 要 密度 函数 中 除了 He “1 这 一 项 后 是 Do 的 函数 , 那 


么 总 景 + 与 成 分 向 量 一 一 定 相互 独立 ， 而 且 成 分 向 量 、 z 的 分 布 就 是 
狄 氏 分 布 , 狄 氏 分 布 的 参数 全 由 这 些 a; 来 确定 .这 也 反映 了 w; 之 


间 有 一 种 均衡 性 ， 它们 不 均衡 的 项 只 反映 在 [上 oi 站 这 一 项 .从 这 


些 分 析 就 可 以 看 出 ， 狄 氏 分 布 在 某 种 程度 上 是 由 于 基 向 量 的 某 种 
均衡 性 决定 的 . 
第 一 章 独 于 分 布 的 矩 告 诉 我 们 ,车 成 分 向 量 (xzo0, 工 1,"…，, 工 ，) 


的 联合 分 布 是 狄 氏 分 布 ,那么 x; 的 期 望 值 Er = wj/ >a)， 
i =0,1,…,n .这 就 告诉 我 们 ,成 分 zx 所 占 的 “比重 ", 只 与 a 在 


Da 中 的 相对 大 小 有 关 ., 进一步 看 , 若 切 向 量 (owo0,w]，……, wr) 的 


联合 密度 是 形 如 
-0+ 


a 


(HB) 
这 样 的 函数 ,那么 F(z) 不 论 怎么 变化 ,都 只 影响 总 量 的 分 布 ,而 不 


影响 成 分 向量 的 分 布 ,成 分 向 量 的 分 布 只 与 上 述 函 数 中 I 
i=0 
这 一 项 有 关 . 
在 结束 本 节 前 ,我 们 再 举 一 个 例子 ,表明 广义 犹 氏 分 布 包含 一 
些 怎样 的 类 型 . 
例 3.5 假定 基 向 量 w= (ao,awl，……aon) 的 联合 分 布 密 度 是 


Pt 


c(TLwsroe 蚂 起 ci > 0,i=0,1,…,n, 
i 二 从 7 


(3.13} 
其 中 c 是 一 个 常数 ,使 上 述 酒 数 在 民 Xi 上 的 积分 为 1. 很 明显 ,此 
时 
n+1l 


凡 
own 
加 (oo ms, wn) 三 了 + 下 
i=1 
Las] 


是 ww， 的 齐 一 次 函数 ,于 是 成 分 向 量 xo0, x1,…, x 的 联合 
密度 是 





"ol 站 | 


xi > 0 = 1112， 


0-1- D>0, a = De ‘(3.14) 


要 求 出 积分 常数 ， 就 需要 下 面 这 个 公式 ， 用 另 一 种 方法 求 ,可 
以 参看 文献 [3] 的 第 十 四 章 的 例题 .现在 我 们 来 证 明 有 关 (3.13) 的 
一 个 积分 公式 , 先 作 一 些 准 备 工作 . 

注意 到 (3.13) 的 积分 常数 c 是 一 个 积分 


"7 了 1 


下 )e "=! 和 dwodw1""den . 


>0 i=0 
i=012. 
{3.15) 
作 积 分 变量 变换 : 
Wo Ho Wi oti, Hi = 2 ;= 1,2, ,7 
tw 
于 是 
Jw0rws en | oor ung) = (Ho) = of, 
i=1 


因此 (3.15) 式 可 以 写成 : 记 4 = 了 a， 
i=D 


cl 一 | «1( IT ea) ) gd, 


“>0 1 
mi 


-ro (D(H ) gd, 


Di 12 
因此 关键 是 求 出 上 式 右 端的 积分 ， 
今 
(Te) (D+ (Tt) ) gd 
i=1 i=1 i=] 


=1,2, 


= |) (Td 
WOLD -1 i=1 j=1 
{3.16) 
引 理 3.2 ， 
(TT 袜 (TTwje)auaduzdw 
> i=1,3. mn 7=1 i=1 j=1 


Hrs a) 





Cnt Dn/An +1))o ~ at11f(1) dt, (3.17) 


其 中 
b= >15 
证 明 “对 (3.17) 左 端 积分 作 变 量 蔡 换 : 令 

= = (Tw),j = 12a 
于 是 和 

“=(1[ 站 JT = (TEx)", 

us ee 
而 有 目 对 i=1,2,-…,n, 有 
dz; = I ww) du + (uw)au, + 
+ (2 [Ts )au 二 十 (Je Ya 


= (1%)> 十 5s Jdu, 

















因此 
gi aa 
=(I[w) + 
挫 Hl 
= (TIE) T+ ||: | (za 
了 | i 
= + DI wy), 
je 
这 样 


* 3“。 


了 (ay 


;un | Z1,°° 























; Zn ) = 《n 十 D-2(II zo) Tl 
代 人 (3,.17) 左 端 ,得 左 端 积分 为 
C+ D7 ( 芷 2 (而 
PD il i=1 
f(D ) dezedz, 
=(n +1)7! | (HD )aer "dzn » 
再 用 引 理 3.1 就 得 (3.17) 右 端 . 
将 (3.17) 用 于 (3.16) ,就 得 到 
1Ir i 十 名 
te 】 1 = 一 和 到: ( 2 | 2 atl (I+) “dt 
“ (a + DTr( | 
> Urle el ra -2 (2 
Cn + Dr( < | Pa) 
因此 | 
{n+ 1)T(a) 
c a 
ro)r(; i) lr(. + | 














代 人 (3.14) ,就 得 成 分 向 量 x:，…,zn 的 联合 分 布 密度 为 


(n + 3)T(a) 











好 0 
r(- 二 1 


)Hr(e+ 





站 


业 


ri: > 人 0, x0 = 1— Dri, i 二 0,1,2, ,nn,， a 二 
i=1 


+ 34 ， 


Cr dr es 


he a Ep i 


村 上 了 
0 | 了 i=1 | ? 
+1 i=] 


CE 


$4. 其 他 成 分 分 布 


除了 狭 氏 分 布 . 广 义 狄 氏 分 布 .加 法 迎 辑 正 态 .乘法 过 辑 正 态 
等 这 几 类 分 布 外 ,当然 还 可 以 列举 一 些 其 他 的 成 分 分 布 ,然而 从 本 
章 兹 面 讨论 的 情况 可 以 看 出 , 狄 氏 分 布 .逻辑 正 态 分 布 无 疑 地 蚌 两 
类 重要 而 基本 的 分 布 ,它们 是 由 相当 广泛 的 一 类 基 向 量 所 导出 的 . 
下 面 我 们 用 举例 的 方式 再 给 出 一 些 成 分 分 布 ,它们 的 统计 性 质 与 
重要 性 看 来 和 上 述 两 类 是 不 能 相提并论 的 ,我 们 列举 一 些 只 是 表 
示 成 分 分 布 还 有 一 些 别 的 类型 . 

原则 上 ,在 单 形 上 具有 非 0 值 的 密度 函数 都 是 一 个 成 分 分 布 ， 
而 且 有 很 一 般 地 导出 成 分 分 布 的 办 法 .因为 任何 一 个 成 分 分 布 均 
可 以 看 成 是 由 基 向 量 诱导 而 来 的 ,原则 上 诱导 的 方法 可 以 有 两 个 ， 
现 分 别 叙 述 如 下 ,然后 用 一 些 例子 来 说 明 这 两 个 方法 是 如 何 诱导 
的 . 

设 基 向 量 中 = (wo, ww,…, ws) 的 联合 密度 是 p(wo,w1,…， 


ww) ,从 引 理 1.1 知道 ,w 相应 的 总 量 上 = lw 二 yw 与 = 
j=0 
cit 1, 一 0,1,.…,n 的 联合 密谋 是 


p(tro, Frei," , tT), 

it>0, zi>0, 1i=0,1,…,n, 2 = 1. 
将 上 述 密 度 对 +* 积分 ,就 得 成 分 向 量 的 分 布 密度 ,这 是 一 种 方法 ， 
在 前 面 我 们 已 看 到 过 . 另 一 个 是 考 虚 条 件 嘱 度 ,-zoyzrliy, rn 对 上 
的 条 件 密度 | . 

plxorzis rs Tat)= £1" p(tr0, tr1,"", ten ) /gE), 

其 中 g(z) 是 : 的 边缘 密度 .如 果 让 z=1, 代 入 上 式 , 可 见 

p(xzosxis™, Ta |t = 1)oc p(xro, zs”, Tn). 
这 就 告诉 我 们 ,任何 一 个 基 疝 量 的 分 布 密 麻 p(wo0yw1,… ,ws) ,只 
要 将 w; 换 成 成 分 x;, 且 不 要 作 任 何 更 动 ,就 引导 出 一 个 成 分 分 布 


* 75- 


的 核 关 zoyzl ,zn); 只 要 在 单 形 上 对 这 个 核 积分 求 出 正则 化 
常数 ,就 得 完全 的 密度 表达 式 .也 即 有 (zzo,zl,…，, zs》 这 个 成 分 向 
芋 的 密度 是 
fxos rls 2) 一 Px 1s von - 
四 (01 jzidr drn 


五 Oi=0.1, ,a 


了 = = 
1 





{4.1) 
很 明显 , 当 上 与 戒 分 向 量 x 相互 独立 时 ,这 两 种 方法 给 出 的 是 相同 
的 成 分 分 布 , 狗 氏 分 布 由 徊 马 分 布 导 出 的 过 程 就 是 一 个 例子 . 如果 
t 与 成 分 向 量 z 不 独立 ,给 出 的 分 布 就 不 会 相同 . 
例 4.1 反正 态 分 布 诱导 的 成 分 分 布 . 
设 基 向 量 wo,owl,…:,amw 的 分 量 相 互 独立 ,各自 遵从 反正 态 分 
布 : 


1 了 
-和 一 中 , 
Wi 一 (去 ) oiie 交 Ve ) » wi>0, i=0,1,2,..",n 


于 是 (wo, wl 的 联合 窜 廊 是 


plooon) = 人 (六 (让 os 锐 吉 
- 估 户 ( 直 ae 近 


现在 分 别 用 两 种 方法 来 导出 成 分 分 布 密度 . 
用 (1,z) 的 联合 分 布 ,得 到 z 的 分 布 密度 
a+1 寺 本 3 
fx, Tn) = ( 冯 ) “ (1) 


Te 


) {4.3) 


TT6-: 





上 式 右 端 中 的 积分 与 贝 塞 尔 函 数 有 关 ,利用 贝 塞 尔 函 数 

Ke(w ab) = 到 (时 eke ”ar， (4.4) 
就 可 以 将 (4.3) 式 表示 成 Kal(v ab) 的 形式 .对 (4.4) 式 右 端 作 积分 
变换 :=r ldr= -1 di, 于 是 有 

KB(V 西 ) = 3 (2) eeede ra, (4.5) 


将 它 用 于 (4.3) 的 积分 ， 





性 填 二 A 1 和 A i 
p= 7 ST 22 x 6 2 
因此 
ll 3 
天 (1， ,Tn) =( | ? es (TL;) 2 
2 | 六 二 引 
2 E ， (4.6) 
1 Xi 2 
(#2 
其 中 


ro=1- zi， zi > 人 0, i = 人 0,1,2,. 并 
i=1 


这 是 用 联合 分 布 求 积分 的 方法 导出 一 种 成 分 分 布 密 度 ; 用 另 一 种 
. 条 件 分 布 密 度 的 方法 可 以 得 到 下 面 的 另 一 种 密度 函数 , 它 的 核 是 


(让 二 3)， 
xi>0, i=0,10,n, xo=1-~ a {4.7) 
这 个 函数 在 Ds = | (zzm) :x > 0，#=1,2,,n， DE 
< 1| 上 积分 , 求 出 积分 常数 后 , 它 就 是 一 类 成 分 分 布 密度 ,很 明 


= 了 7 


显 ,这 个 积分 是 不 易 求 出 的 . 因为 有 xz。 1 yz 在 指数 的 和 
i=1 


中 ,而 且 逐 有 (1 - > zx: ) ,这 一 类 成 分 分 布 的 密度 和 (4.6) 明 
显 地 不 同 .类 似 地 可 以 从 广义 反正 态 分 布 中 诱导 出 别 的 分 布 

例 4.2 从 贝 他 分 布 导出 成 分 分 布 

设 基 向 车 (wo,w1,…, ww) 的 分 量 相互 独立 ,各 自尊 从 贝 他 分 


T(a;+ bi) wr ! 
i Tiai)T'(p;) (1 十 ty Jo 
用 引 理 1.1 ,就 得 (+ ,xz) 的 联合 密度 为 


-站 Tatb) (rw)! 
* 6 Ta) Tb) (+ ee)? 





>0, i=0,1,2,.",n 


上 六 站， 


ro = 1- Dz, zi>0, i=0,1,2,.…,n 
对 上 从 0 到 co 积分 ， 就 得 成 分 向 量 的 密度 : 
TT Tai+ bi) -1 2 dr 
JT > OA ao ~ or 
( 工 ea) 六 IT[d+ ze Ja 
其 中 
好 二 Da,, z=1- Dr, TO0, i=0,l."",n 


三 习 


例 4.3 设 基 向 量 (wo,w1,…,w。) 的 分 布 密度 是 
Kl Joe) ( > jos 


wi > 0 a>0, b>0,g>0,a>0,i=0,1,2,,n 
(4.8) 
其 中 KK 是 一 个 常数 ,使 这 个 函数 积分 为 1， 因此 先 讨论 K 的 值 在 
什么 条 件 下 是 一 有 限 值 . 
利用 人 马 函 数 的 性 质 ， 


“78 - 


me a Ee A 


一 上 ee) = ea ; 
(2 3 Lu 】 
于 是 


K-! 





| (He a, -1)e -Be s( Dom) ydue- dd 


m0 
rs 


= Fi 1 wl Je SS gs doe-de 
Te dg i=0 
sD 


1I Tla;) 加 本 
gs， 





因此 ,只 要 》\ w> 9q, 上 述 积分 值 是 有 限 的 ,所 以 天-! 是 有 限 的 ， 
i=0 
特别 地 , 当 4; 一 A,b;=5 对 所 有 i 成 立时 ,就 得 











四 生 rr 
“1 (22) 1 了 fa -aT (oy 
了 (9) A- Tr(a) " 
其 中 
a = Dai, 
和 
因此 
Tla 
K= UH ' ) re - ) 
IT'(a) 2 9 * 


从 (4.8) 式 通过 两 种 途径 可 以 诱导 出 分 布 为 
Kk (1) Dom) Ae -a 


{4.9) 


因此 ,这 一 类 成 分 分 布 也 与 广义 的 狼 氏 分 布 有 关 , 上 式 中 4 = 


Par0 — 二 1~ Da “ 
用 条 件 分 布 的 方法 可 诱导 出 另 一 一 类 分 布 是 


Li -Da 
(He ) -SO ,< 是 常数 ， 


让 0 二 1— ri， Ti > 0, 1 二 0,1,.,n. (4.10) 


从 上 面 的 各 个 例子 可 以 看 出 成 分 分 布 的 分 布 族 是 可 以 有 多 种 
形式 的 , 它 并 不 是 只 限于 某 几 类 ,至 于 哪 一 种 分 布 相 当 于 一 般 情况 
下 的 正 态 分 布 ,起 着 基本 而 重要 的 作用 ,这 还 是 一 个 值得 探索 的 问 
题 . 

对 于 加 法 逻辑 正 态 分 布 , 用 (1,z) 联 合 分 布 对 : 积分 求 边缘 
分 布 ,这 已 熟悉 了 , 它 是 由 基 向 量 w 坦 从 对 数 正 态 诱导 得 来 的 ,我 
们 用 条 件 密度 的 方法 ,可 以 得 到 形 如 下 式 的 分 布 密度 


cf IT[ xri! )e be 
i=0 
或 
cf 让 1 je ee) Dm) 
上 


t=0 


其 中 
x0=1- Pa, Ti >0, i=0,1,,n, 


c 是 一 正则 化 常数 . 这 一 类 分 布 中 求 出 ce 的 表达 式 比 较 困难 . 
这 些 例 子 足 以 说 明 用 这 两 种 方法 可 以 诱导 出 不 少 成 分 向 量 的 
分 布 类 型 ,这 一 讨论 就 到 此 为 止 . 
在 结束 本 节 之 前 ,我 们 要 总 结 成 分 分 布 中 常用 的 计算 多 重 积 
分 的 方法 ,从 数学 分 析 或 从 黎 曼 积分 的 观点 来 看 ,一 些 公 式 的 获得 
"B00: “ 


是 不 容易 ,而 县 往往 要 求 被 积 函 数 在 连续 性 上 有 好 的 性 质 , 然 而 从 
概率 论 或 者 浏 度 论 的 观点 看 来 ,不 需要 连续 性 的 要 求 ,只 要 可 测 、 
可 积 ( 勒 风格) 就 可 以 了 ,而 且 积 分 公式 的 证 明 非 常 简便 .我 们 就 以 
在 本 书 中 经 常用 的 公式 为 例 给 以 说 明 ， 
著名 的 喀 塔 朗 公 式 是 : 
1 


mgtrl ra HEM 
op g(z)dy(z) = (Ri Ca ) sadu， (4.11) 
式 中 (5)| 表示 斯 蒂 阶 斯 积分 , (R)| 表示 黎 曙 积分 ，%(z) = 


f(x 3 :Tn ldxi'"*dzr - 
mtr EM 


从 概率 论 的 观点 来 看 ,{4,11)? 的 证 明和 意义 是 十 分 明显 的 . 首 
先 我 们 对 A(z1,… ,zn) 可 以 假定 为 非 钠 坦 贝 格 可 积 就 驶 了 ,因为 
任 一 可 积 的 了 一 定 可 以 写成 f= 了 f* -了 7,f* 和 六 分别 是 非 负 可 
积 的 .由 于 大 zi…zo) 非 负 可 积 , 其 积分 为 有 限 值 , 于 是 可 以 无 
妨 假 定 F(x],… ,zx ) 是 随机 向 量 (&1,…,&,) 的 联合 分 布 密度 , 假 
定 g ,9 都 是 波 来 儿 可 测 应 数 ,并 且 使 得 Ep(g(81,…,&)) 有 限 ， 
于 是 Ep(g (5&1,…,é&)) 可 以 用 两 种 写法 来 表示 ,将 plg(&1,…， 
6)) 看 成 是 (&1,…,&) 的 函数 , 则 


Ep(g(&1°,6)) = 人 Faiz 


x plg(ris ns Ta dr dir, 
如 果 令 39= gt 名), 则 ?的 分 布 函数 
F(t) = P(t) 
~ J fr dz dz 
Ri Js 
三 名 二 + Flm). 
将 9(8( 6) 看 成 :了 的 函数 p(y), 则 有 


"81: 


re 


Fpl n) = [pCu)dFsu) 
= [g(aylu) 
= [p(w) dg, 
因此 对 任 一 非 负 波 来 儿 可 测 函 数 9 成 立 下 式 : 
| pr ) pg (r,s ea) ) dide 


= gC)dy(u) 


=| 96) Metsdas. (4.12) 


从 上 式 不 难 立 即 得 到 (4.11). 从 概率 论 的 观点 来 看 ,车 (&1,…, 6,) 
的 联合 密度 是 f(z1,… ,zn) ,而 二 g( 红 ，,…, 各 ) 的 分 布 密度 是 已 
知 的 ,于 是 求 p(w) 的 概率 就 是 一 个 单 积 分 ,不 论 9 与 (名 名 ) 
是 否 独 立 . 这 正 是 (4.12) 式 左 端 和 右 端 的 内 容 . 下 面 我 们 用 一 些 例 
子 来 说 明 (4.12) 式 的 作用 . 

车 将 (4.12) 理 解 为 多重 积分 能 用 一 个 右 端 形式 的 单 积分 表 
示 , 并 且 gf(') 是 任 一 非 负 可 积 的 函数 都 成 立 ,我 们 就 知道 右 端 相 
应 于 dy(u)Adu 这 一 函数 它 就 是 的 分 布 密度 .所 以 这 个 等 式 可 
以 有 不 同 的 作用 ,看 是 如 何 去 用 ， 

例 4.4 设 局 村 名 立 ， 志 各 自尊 内 伽 马 分 布 ， 


~ Fe Fa ie, i 二 二 ,之 ,天 
于 是 从 概率 论 已 知 ? = 也 考 从 仰 马 分 布 , 密 度 是 


mes uw le, uw>0, a= D0.. 
因此 从 (4.12) 知 道 ， 天理 负 可 各 的 Pp(*), 就 有 等 式 
| ( 开 居 Pa je p (Di)driedz, 


二 ,这 站 
t=1123""s 


=" 2 ， 


me RT eh ee 


= epCoOerre "du (4.13) 
这 正 是 我 们 前 面 已 用 过 多 次 的 公式 . 

从 这 个 例子 看 ,似乎 独立 性 起 了 重要 的 作用 ,其 实 并 不 是 这 
样 ,我 们 从 下 一 个 例子 看 出 ,独立 性 并 不 是 重要 的 . 

例 4.5 设 ( ,二 ,) 的 联合 密度 是 

(Ha (Ba), x >0, i=1,2,.,n, 
=1 

因此 El 不 一 定 是 独立 的 . 对 任 一 非 负 的 可 积 天 数 g(*), 从 
{4.13) 就 得 (把 这 里 的 p()d( 看 成 (4.13) 中 的 pg('))， 


| (Da) (De), 


测字 人 12 


让 ro 
= iid upg(u)gq(u)du, a = a, 


TT ra) 
因此 9 ~ 6 的 密度 就 是 局 ray 一 wg(u) .这 样 用 一 下 公 
式 直接 就 求 得 9 = > & 的 分 布 ,这 里 不 要 求 1，…, 各 相互 独立 ， 
不 难 将 上 述 例子 形式 再 复杂 化 , 考虑 g( 开 x) 是 
4 ( D2 bth ) 的 形式 ,从 而 导出 一 些 多 重 积 分 的 公式 ,这 些 已 不 是 
本 书 的 内 容 了 。 


$5. 与 方向 性 数据 、 球 分 布 的 关系 


现在 从 另 一 个 前 度 来 看 单 形 上 的 分 布 .在 多 元 统计 分 析 中 , 球 
对 称 分 布 (简称 为 球 分 布 ) 是 一 类 特殊 的 分 布 ,方向 性 数据 的 统计 
分 析 是 一 个 特殊 的 分 枝 , 后 者 涉及 到 在 单位 球 球面 上 的 分 布 ,然而 
从 下 面 移 讨论 中 可 以 看 出 ,它们 与 单 形 上 的 分 布 有 密切 的 联系 . 


"BS + 


th :eT 





4 二 1 维和 随机 向 量 = (ups 1 z 了 的 分 布 称 为 球 分 布 ， 
恕 果 对 和 任 一 给 定 的 正 交 方 阵 卫 有 与 & 的 分 布 相同 ,由 于 在 正 
交 变 换 群 下 ,最 大 不 变量 是 向 量 长 度 , 正 交 变换 相应 的 雅 可 比 行列 
式 绝对 值 是 1, 因 此 就 知道 球 分 布 如 有 密度 , 它 的 密 诬 函数 一 定 是 
fw) 的 形式 .因此 我 们 可 以 用 简单 的 符 导 来 表示 , 即 

he fe) (5.1) 

如 果 令 的 函数 ;w= ni， i =0,1,…,n 作为 研究 的 对 象 , 则 
ww 一 (ooywiy yo 是正 随 机 商量 ,于 是 从 球 分 布 (5.1) 可 以 导出 
中 在 尺 *+1 上 的 分 布 .现在 来 看 由 (5.1) 导 出 的 'o 的 分 布 有 什么 特 
性 . 

引 理 5.1 KR,+1 上 的 可 测 陪 数 Fa 心 ) 著 使 下 式 左 端 有 意义 ， 
则 下 述 等 式 (5.2) 就 成 立 . 


| 。 MAS ‘wu dw = (Ho 2 4 )r( > jdaoodoi "do, 
+] 
I 
~ 7 
r (3) 
证 明 注意 A(wz) 的 值 与 w; 的 正 负 号 无 关 , 于 是 
| wu)du 一 2 fue 
在 RR+* 11 上 作 变 换 ; ww, = wi， i 二 0,1,…,n ,于 是 
du = 2udu， 即 du; = rtde, i = 01 
这 样 就 得 到 
| ed -|」. 【于 )f (De) donde de， 


(5. 2) 的 第 二 个 等 式 是 引 理 3.1 的 结论 ， 这 样 我 们 就 证 明了 
(5.2). 
(5.2) 告诉 我 们 , 从 球 分 布 fi(w ww) 可 以 导出 形 如 


+ 


1FCtydt， (5.2) 


(LI[e 4) (2 ; ) 的 基 向 量 的 分 布 , 它 相应 的 总 量 * 与 成 分 向 
量 < 一 定 相互 独立 ,并 且 成 分 向 景 z 洲 从 的 是 一 个 特殊 的 狄 氏 分 
布 . 

如 果 反 过 来 考虑 ,从 RR+,1 上 一 个 基 向 量 w 的 分 布 能 不 能 引 
导出 一 个 R,+1 上 的 球 分 布 或 其 他 的 分 布 呢 ? 

从 (5.2) 的 证 明 中 我 们 已 经 看 到 如 果 我 们 要 求 w 的 分 布 对 于 
正 交 群 的 一 个 子 群 保持 不 变 ,那么 R, ,1 的 一 个 密度 和 RR+,1 的 密 
度 可 以 有 1-~1 对 应 的 关系 ,这 个 子 群 就 是 反射 群 ,也 即 

G= T= (7y):; Ys = 1 或 -1， 
7 三 人 0 只 要 i 说 关 j =0,1,2,…,n|. 

这 个 群 相应 的 最 大 不 变量 就 是 向 量 各 个 坐标 的 绝对 值 . 

车 的 密度 函数 是 了 (Tuo|?, | wil?,…,|w1?), 了 在 R41 
上 有 定义 , 则 令 w= x3,i=0,1,…,N;w 二 wg yo 后 ,的 


密度 在 R41 上 是 (本 @ 革 (wo,w1,…,ow) ;反之 ,车 先 给 了 基 
砚 基 ww 在 民 iji 上 的 密度 是 函数 plewos wr wn ) ;RO 令 Hf = oj， 
i 二 0,1,, nn 后 ,= (wo, di;…, un) 有 具有 反射 不 变 的 密度 
(I || )p (a8 ut, ,M2 ， 当 w 的 密度 f{ |uo|?， | 1|?,-., 


| |? ) 只 是 3 的 函数 时 ,ww 就 是 球 分 布 . 这样 我 们 可 以 较 清 


楚 地 看 到 x 的 分 布 与 基 向 量 w 的 分 布 之 间 的 联系 . 
如 再 进一步 考虑 .随机 向 量 w 的 分 布 ,是 否 具有 反射 不 变 的 
性 质 与 & 的 方向 部 分 有 密切 的 关系 .实际 上 wu 总 是 可 以 分 解 为 两 
部 分 :长 度 及 方向 , 即 
Fe 一 (Dl? 
i=0 


y(n) = ur £ = 0,1,.,n, 


ET 


Yo(u) 


ry 
上 
I 








To) 
区 一 六 yo 

rs 的 长 度 部 分 ,和 是 w 的 方向 部 分 .如 果 令 ow 一 w?,i=0,1， 

1 于 是 外 =(oooyeol， ,wn) ,此 时 用 ry, 与 y。 表示 由 ,就 得 


ww; 二 (YC) =r2 ， 1 二 站 1, 之 ,天 
而 w 相应 的 总 量 * 与 成 分 过 = (xzo…xza)y 与， 思 的 关系 是 
一 Do 一 r2， 


Xi 三 (yu) ), i = 0,1,.…,n. 

这 就 明确 地 显示 了 成 分 与 方向 向 量 之 间 的 密切 关系 . 纵 定 R, ,1 上 
的 一 个 分 布 ,我 们 可 以 从 此 分 布 的 方向 向 量 7, 的 分 布 诱导 出 一 
个 单 形 上 的 成 分 分 布 ;反之 ,给 定 了 一 个 R, ,1 中 单 形 上 的 成 分 分 
布 , 总 可 以 由 它 扩 展 成 一 个 尽 ,+1 上 方向 向 量 的 分 布 ,这 个 分 布 具 
有 反射 不 变 的 特性 , 从 这 个 角度 来 说 ,成 分 分 布 可 以 看 成 是 方向 向 
量 分 布 一 个 特殊 的 部 分 . 
” ”从 上 面 的 分 析 我 们 还 容易 看 出 ,随机 向 量 x 分 解 为 长 度 r。 与 
方向 7, ,这 与 基 向 量 w 分 解 为 总 量 上 与 成 分 向 量 x 是 完全 相对 应 
的 . 而 球 分 布 在 R, 中 占有 重要 的 地 位 , 它 相应 的 是 x, 与 7 相 
互 独立 ,而 且 7y。 是 球面 上 的 均匀 分 布 , 在 基 向 量 w 的 分 布 中 ,与 
之 相应 的 是 总 量 * 与 成 分 相互 独立 ,成 分 服从 狼 氏 分 布 . 从 这 一 比 
较 中 也 可 以 看 出 狄 氏 分 布 的 重要 . 

在 尺 ,+1 中 ,单位 球 球面 上 的 点 用 坐标 来 表示 ,坐标 记 为 (ao， 
ul"…s Un》 ; 则 有 


i 
Du?= 1, 
i=0 


Ki us, UU 三 0,1,2, "7,7, 则 访 ) 江 ; 一 1， 
= 位 


且 
Ti 0 
可 见 球 面 上 的 点 可 以 与 单 形 上 的 点 发 生 对 应 ;反之 单 形 上 的 点 也 . 
可 与 球面 上 的 点 对 应 . 现在 利用 这 种 对 应 关系 来 看 一 些 成 分 向 量 
的 分 布 . 
. 例 5.1 球 画 上 的 均 名 分布 与 单 形 上 的 均匀 分 布 . 
从 球 分 布 的 性 质 我 们 知道 标准 正 态 分 布 
1 ntl 六 2 
[二 | 2 
是 Ra+i 中 的 球 分 布 , 它 的 长 度 部 分 与 方向 部 分 相互 独立 .长度 部 
分 用 + 表示 , 则 让 一 x*(n +1), 方 向 部 分 用 (wo,w1,…, wn) 表 示 ， 
则 (wl,…, wn) 的 联合 分 布 密 度 是 


r +1 1 和 
ri al DA), Dui<l (5.3) 
BE 


而 且 知 道 (w0, 1，… ,un) 是 球面 上 的 均匀 分 布 . 因此 (5.3) 就 给 出 
了 球面 上 均匀 分 布 的 密度 的 表示 式 .利用 x; = ut ,dzx;=2wdui,i 
=1,2,…，,za ,从 (5.3) 式 可 了 以 导出 单 形 上 (rozl，……z) 的 联合 分 
布 密度 ,而 且 它 也 就 是 单 形 上 的 均匀 分 布 ,计算 一 下 雅 可 比 行列 式 
就 得 到 


ri2 +1 
2 mT _1 ni 3 
(le) De)?, zi>0,Dzr<l, 
rT(3 i=1 = i=1 
即 为 . 
Fr( 2 )r Tt, zi >0, Dr<1 Yl 
i=6 i=l i 


{5.4) 
这 是 狄 氏 分 布 的 一 个 特殊 情形 . 
从 这 个 例子 可 以 看 出 ,球面 上 的 分 布 可 以 用 低 一 维 的 单位 球 


，g7 - 


本 rn 


上 的 分 布 来 描述 ,因此 单 形 S; ;1 上 的 分 布 可 以 用 低 一 维 的 D, 上 
的 分 布 来 描述 .只 要 对 单位 球 上 的 分 布 有 所 讨论 ,就 相当 于 对 品 ， 
上 的 分 布 有 所 讨论 ,也 就 是 对 单 形 S,+1 上 的 分 布 有 所 讨论 .因此 
下 面 的 积分 公式 就 可 以 起 相当 重要 的 作用 . 


| (TE lt) fu) du =| | 1 zx)F( dD mdz 
R, i=1 和 RR 1 ji nl 


IT ra) 
-< 一 一 全 Be par 
r(Sa) 
(5.5) 


这 一 公式 的 证 明 只 需要 将 上 式 左 端 积分 利用 对 称 性 ,可 表示 为 
2 { I! mal FC ut du, 


Ti Wi, = 1,2,n, dr = 2udui, 
得 到 
2 (Tu au = J (Ta) Ba) 


上 式 右 端 是 已 知 的 , 它 的 值 就 是 45.5) 的 右 端 ， 
有 了 这 个 (5.5) 式 ,就 可 以 将 单位 球 上 的 一 个 分 布 密度 与 单 形 
上 的 分 布 密度 建立 对 应 的 关系 . 


在 R, 中 单位 球 > 43 之 1 上 的 分 布 密度 ,一 定 可 以 写成 


(TT iw IC < F(a ts) 

. 一 
的 形式 ,其 中 

， | 当 a 女工 ， 

I{x'w < 1) = 0， 其 他 . 

因此 只 要 a,… ,wn) 是 uw 的 图 数 , 它 有 h(nww) 的 表达 式 , 则 


* 83 : 





从 (5.5) 式 就 引导 出 一 个 在 DD, 上 的 分 布 密度 


(I (Ss), x >0, Dr<l. 
i=1 E=1 
写成 与 S,, ,有 关 的 表示 式 ， 就 是 


(TT zs — Xo), zi >0, i=0,1,",n, Dx = 1, 
从 这 里 不 难 引 出 一 些 别 的 成 分 分 布 的 密度 . 

90 年 代 以 来 ,多 元 统计 分 析 中 出 现 一 类 分 布 称 为 算 可 分 (ra- 
dially decomposabte) 分 布 .这 一 类 分 布 的 特点 是 与 a 对 称 分 布 族 有 
关 , 与 成 分 向 量 的 分 布 也 有 关 . 现 给 出 它 的 定义 并 讨论 它 与 成 分 向 
量 的 联系 . 

定 尽 5.14] 随机 向 量 2 称 为 是 具有 径 可 分 分 布 的 随机 向 
量 , 如 果 存 在 正 的 随机 变量 尺 , 另 一 个 与 及 独立 的 随机 疝 量 zx1l 
的 tw ,使 得 

z Rr, (5.6) 
即 = 与 Rw 具有 相同 的 分 布 此 时 称 R 为 x 的 尺度 (scalar),zw 称 
为 基本 辣 量 (base vector). 

匠 忆 一 下 我 们 在 前 面 讨 论 过 的 形状 与 大 小 ,这 两 者 又 有 区 别 
叉 有 联系 ,有 关 这 一 方面 的 讨论 留 给 读者 去 考虑 .我 们 讨论 径 可 分 
的 z 有 什么 特殊 的 性 质 . 

引 理 5.2[4 设 以 =) 是 = 的 函数 , 且 

ttaz) = ttz) (5.7) 
对 一 切 e>0 成 立 , 则 区 =) 二 1{w). 

这 条 引 理 告诉 我 们 ,只 要 ttxz) 是 一 个 齐 0 次 的 函数 ,或 者 说 
它 对 只 度 变 换 ( 即 自 蛮 基 科 一 个 正 的 常数 ) 不 变 ,那么 它 的 分 布 就 
只 与 w 有关. 现在 来 给 出 证 明 

证 明 考 虚 特征 函数 

ps) (0) = = Fedttr) 一 E{E| ettRu) | R}) 
=E(Ele "|R}) 


pod 


一 Ee”) 


= po) (0). 

这 一 性 质 引 出 很 多 有 用 的 结论 ,有 关 的 内 容 可 以 参阅 文献 [4]. 

注意 到 我 们 一 直 讨 论 的 基 向 量 ( 不 是 基本 向 量 )w 分 解 为 总 
基 * 与 成 分 向 其 x 时 ,总 量 上 与 成 分 独立 ,就 表示 w 是 一 个 径 可 
分 的 随机 向 量 ,我 们 对 比 一 下 就 清楚 了 : 

基 向 量 ww 一 一 一 随机 向 量 z 
Ww tr 二 Rw, R>0 
上 与 独立 民 R 与 ww 独立， 

差别 是 两 条 ， 

i) 基 向 量 w 要 求 它 的 分 量 都 是 正 的 随机 变量 ,而 对 径 可 分 
的 z 并 不 要 求 ; 

{说 ) w= tz 是 一 个 真实 的 等 式 ,而 z 车 Rw 是 一 个 在 分 布 意 
广 上 的 等 式 , 后 者 的 要 求 就 更 能 一 些 . 

从 一 定 的 意义 上 看 , 径 可 分 的 概念 是 推广 了 成 分 与 总 量 ,形状 
与 大 小 ,引导 到 一 个 更 一 般 的 情形 . 





本 题 二 


1. 由 俐 马 函 数 的 定义 
了 Te) = [eede, a>o, 
直接 证 明 

[ant =- 旺 全， a>0， 昌 >0，B>0. 

如 果 5<<0, 上 述 等 式 应 如 何 收 改 ? 对 5 关 0,a >0,8>0, 能 否 有 一 个 统一 的 
公式 . 

2. 如 果 基 向 量 w 的 大 小 G(w) 与 形状 so(w) 相 互 独立 , 则 对 任 一 大 小 
仑 区 o); 个 (mw) 一 定 与 zc,《w) 相 互 独 立 .进一步 考 磋 xc (ww) 与 zo(w) 分 布 
密度 的 关系 式 ， 

3. 对 于 二 分 割 的 逻辑 正 态 分 布 共有 儿 种 ? 写 出 相应 的 密度 .进一步 讨 

站 oO 


论 三 分 割 的 分 布 密度 育 多 少 种 不 同 的 ,能 否 给 出 一 般 KK 分 割 的 不 同 密度 的 
个 数 (注意 每 个 分 割 的 子 成 分 可 以 各 自选 用 加 法 逻辑 正 态 或 腾 法 逻辑 正 态 ， 
些 外 还 有 子 成 分 总 量 形成 的 向 基 z, 它 也 有 两 种 选择 ). 

4. 证 明 等 式 (3.5). 

5. 著 基 向量 的 分 量 w; 相 友 独立 , 且 





A wil) -和 
:~ F(a™ ew, i 二 0,1,,n. 


求 它 相 应 的 成 分 向 量 前 分 布 密度 . 
6. 车 基 向 量 a 二 (0 U1" ,wa 的 联合 窗 度 是 





Er ct (ll i (Do), wi > 0 = 0,l,",n, 
其 中 Cta; 门 为 一 常数 ， a aa msdn) 
《5D 求 出 Cla ;由 的 表达 式 . 


(GD 若 。 = Ya 是 (0,1) 区 则 内 的 入 ， 
3 


AP)= + Do) 
求证 ; C(o3/) = 一 te) siner 


(说 ) 车 a = 2a; , 且 
了 一 让 


Fy 一 De 
求证 : Cta;f) = 一 ze) 先 ， 
re)” 
从 这 拖 个 不 局 的 了 选择 中 ， 你 可 以 看 出 , 成 分 向 量 服 从 狭 氏 分 布 时 , 基 向 量 
的 联合 分 布 可 以 相当 复杂 而 广泛 ， | 


(( 雇 , (者 ) 两 题 的 积分 可 贿 看 TM. 菲 赫 金 哥 尔 苞 的 微 积 分 学 教程 第 十 
四 章 》 


7 了. 证明; 当 基 向 量 w 的 分 布 是 (4.4) 式 函数 时 ,成 分 向 量 x 对 总 量 ; 的 
条 件 密 麻 是 (4.61)， 

8. 若 Inz 与 Iny 是 正 态 分 布 ,及 与 独立 , 训 又 与 y 独立 , 则 站 概率 
为 1 是 一 个 常数 .( 给 出 与 定理 1.2 不 同 的 证 明 , 提 示 : 证 明 


+ gl * 


Varflnr — Iny) = 人 

9. 车 基 癌 重 是 相互 独立 的 分 量 , 每 个 分 量 都 是 广义 反正 态 分 布 ,试用 商 
种 方法 导出 相应 的 成 分 和 分布 密度 ， 

10. 用 本 章 的 (4.12) 导 出 (4.11). 

11. 对 (lnzi ,linzxa,lnr3) 这 个 向 量 ,不 存在 对 数 比 不 相关 ,但 存在 对 数 对 
比 不 相关 ;对 (lnzi ,nrz,jnzi,inzi) 这 两 者 关系 又 是 怎样 呢 ? 

L2. 讨论 径 可 分 随机 向 量 的 形状 与 天 小 的 关系 . 利用 这 个 结果 可 以 导出 
一 些 什么 结论 (将 它 用 于 径 可 分 向 量 : 如 标准 正 态 分 布 的 情形 ) 
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第 三 章 “” 远 辑 正 态 分 布 的 统计 分 析 
$1. 估 计 


本 章 限于 成 分 向 量 x 服从 逻辑 正 态 分 布 的 情形 ,以 下 不 再 逐 
一 声明 ， 
为 了 用 =” 表示 样本 容量 的 大 小 ,总 假定 成 分 向 量 是 p+1 维 ， 
T= ro Kis "sr Ty) ,Tt 的 样本 用 抢 阵 已 来 表示 ,XX 的 每 一 行 是 
一 个 样本 , 即 
TD 


让 一 
nxtp+tty 





|- (en) “ 1,2 on i = 0,1,.…,p. 


(a) 


于 是 


y={-1 Jnz={-E I) 


lnxo 








inz， 


遵从 正 态 分 布 N(P , 忆 ).? 相应 的 样本 用 矩阵 Y 表示 ,也 即 


Y 会 dnx) | 





_ _ 
1 = (ne) | 1 js (nxX)F, (1.2) 
它 是 由 XX 加 工 生成 的 . 

现在 来 看 成 分 向 中 的 估计 间 题 与 一 般 多 元 统计 分 析 的 估计 有 
什么 不 同 , 应 该 怎样 处 理 . 

描述 成 分 向 量 x 的 参数 ,自然 是 它 的 期 望 值 向 量 , 它 的 协 方 
差 什 阵 , 这 两 组 参数 是 重要 的 .我 们 用 8 表示 Fzr ,次 寄 示 z 的 协 方 
差 答 阵 , 妈 


”本 他 ， 


Exro 
— 二 (ny) 一 {E(xz; — Eri)(z; 一 Er;)), 


8 ;区 
{pti}xl tplxtptly 








p 
i,j = 0,1,…,p. 


现在 的 问题 是 ,如 何 求 8 与 光 的 佑 计量 各 与 浴 
注意 到 》\z， 一 1 总 是 成 立 的 ,因此 自然 有 
i 


=E(Y zi)= DEzx, = 工 日 ， 
0=El(r- Ex}(x — Er)’1 (1.3) 
=1E(z 一 了 rifzr — Ez) 1 = 1%1. 
上 式 由 于 交 是 一 非 负 定 和 矩阵 , 它 就 等 价 于 交 1=0, 即 1 是 光 的 特征 
值 为 0 相应 的 特征 向 量 .这 表明 参数 与 光 是 受 约 东 的 .由 第 一 
章 习 题 6 的 结论 知道 一 定 存在 正定 阵 吕 ,使 得 
x= 0 QIN TALN1 1). 
因此 我 们 将 8 与 净 的 约束 条 件 (1.3) 可 以 写成 
i =1, S220， 1 = 二 0,1,2,'",p， 
“po Ni ONAN 1)}), >0. 


现在 来 寻求 满足 条 件 (1.3) 的 情 计 量 和 痉 从 统计 的 观点 来 
看 ,有 三 种 方法 可 以 导出 相应 的 估计 ， 

( 矩 帖 计 法 

用 样本 的 均值 去 估计 总 体 的 均值 ,用 样本 的 协 差 阵 去 佑 计 总 
体 的 协 差 阵 , 于 是 有 


8 =Lx 1 会 z， 
再 

记 = 二 【ztey — EIT 一 二 了 【1.4》 
a=] 

_1 二 和 1 

=2X(I 11 Xe 1 


现在 来 看 (1.4) 的 个 计 是 否 合 于 (4.3) 的 要 求 .注意 到 共 的 每 

一 行 都 是 成 分 何 量 的 样本 ,自然 有 
XL = 

因此 1 =1F = 二 1X 1= 填 11.=1, 计 1= 了 Le 一 0,2X 是 非 负 
定 的 .可见 (1.4) 给 出 的 估计 是 合 于 (1.3) 的 条 件 的 ， 

(利用 y 的 样本 来 给 出 估计 

因为 y 一 Na 2), 国 此 从 正 态 分 布 的 性 质 就 知道 y 的 样本 
均值 和 样本 协 差 阵 是 x 和 了 的 优良 估计 ,这 就 得 jy 和 的 估计 基 


Y’ 1 = TF' (nxX)’ 1, 


再 nn 


全 1 本 1 了 1 
=— YY {t= 
之 n-l 4 1 ) 如 一 1 


(1.5) 
Ls 


其 中 

F’=(-1 4), 

Ly =F (lnX) (1 -BE )(nX)F 会 FLueuuE， 
问题 是 参数 , 引 与 参数 9 , 光 之 间 的 关系 如 何 表示 ,怎样 利用 这 
个 关系 式 时 出 用 站, 引 去 求 6 和 交 

要 求 p, 与 9, 次 之 间 的 关系 ,必然 涉及 到 y 与 工 的 关系 ,y 
与 x 的 联系 是 
yi: = inzri ~ Inzo = In 寺 ， i=1,2,,p, (1.6) 
它 也 可 以 写成 


Ti 
xo 

这 两 个 不 同 的 表示 法 可 引出 丙种 不 同 的 估计 . 
用 Intt+z) 主 z 的 近似 式 , 从 (1.6) 就 可 以 得 


Wo 


=e, i=1,2,,p. (1.7) 


+ 5 "， 


因为 
=Inz; ~ Inro = In(l + (zx; — 1))- in(1 + (xo — 1)) 
rl1—-xot+l 二 rx,~ xo, 
因此 
pi = Ey = Eri— Ero = 6 to, i=1,2,,p, 


Dp = D0 p00 =1- (p+ 1)0. 


因而 就 有 
{0 3 i = 1,2,."…,p, 


(1.8) 
On = (1 一 六 wj/ 十 主 ) 
将 六 用 3 代入 上 式 , 可 得 及 站 .加 此 求 得 的 上 能 满足 T 8 = 1， 


但 6: 或 bo 可 能 会 出 现 负 值 ,这 是 不 合 要 求 的 . 

当然 还 可 以 将 mz = in(1+(x; 一 1)) 包 展开 几 项 来 求 关系 
式 ,然而 这 样 的 讨论 就 很 繁 珊 , 这 里 就 不 展开 了 . 

用 (1.7) 式 ,利用 y 是 正 态 的 性 质 ,知道 


EE = Ee = ez%, i=1,2,,p, 
将 上 式 两 端 对 i 求 和 得 


Ea eh 


E 让 二 1+ Dd. 
利用 算术 平均 ,调和 平均 不 等 式 , 由 于 zo>0, 得 
Ero> (Ero') l= (1+ Set) 
将 上 述 不 等 号 看 成 等 号 ,就 可 以 引出 4 的 估计 


于 是 有 





一 + 由 (1.9) 
6; = ei (+ er )， i = 1,2,°,p. 
i=1 
{1. 9) 式 的 估计 不 会 给 出 不 合理 的 非 负 售 计 ， 而 且 它 与 y 的 样本 
均值 y 及 样本 协 差 阵 的 主 对 和 角 元 素 了 jj 即 
> = Lo =【《657) 
中 的 主 对 角 元 有 关 .(《1.9) 式 合乎 约 东 条 件 16 = 1 因此 它 是 利用 
了 yy 是 正 态 分 布 的 这 一 特性 导出 的 .然而 也 不 难看 出 ,这 一 估计 
还 不 是 很 理想 的 , 它 也 是 一 种 近似 的 估计 . | 
从 对 数 正 态 分 布 的 性 质 知 道 { 克 第 一 章 (4.6)? 式 ) 


cov( 至 ,7 exp 《e 1)， 


于 是 从 六 及 只 可 以 给 出 (型 ，…, 开 ] 扩 相应 的 协 方差 吞 阵 的 估计 . 
但 要 给 出 光 的 信 计 就 更 麻烦 了 . 从 这 里 可 以 看 到 成 分 数据 统计 分 
析 确 有 它 的 特殊 困难 

Ci) 利用 zw 与 % 之 同 的 关系 式 ,从 大 样本 角度 考虑 给 出 的 
信 计 . : 

因为 x; 与 y; 之 间 有 关系 式 


Xi = ef (1 + >) ， =1,2,…,p,， 


xo = {1+ eo 


j=1 








Lit p+ Co + oi) 


因此 


Er = E(e(1+ Ye) ) 全 Efity) ， t= 1,2,",p, 


1=1 


fy) = 万 (人 oo) 


afi 
= fi(Ey,., Ey,)t+ > EA — Ey)+r, 
j=1 了 


其 中 种 端 r 为 展 式 的 余 项 , 略 去 余 项 r ,对 二 端 求 期 望 ,就 得 近似 
式 
Ef{y) 二 开户 (下 Eyp) = fF (Eyl,*, Eys) 3 


也 即 有 
0 fit es), i = 1,2,"…,p,， 
i™! (1.11) 
6 二 (1+ D0) 
于 是 就 得 8 的 估计 量 
B= ef (1+ De), t= 11,2, ,pp， 
1 (1.12) 
8 = (1+ Pen) 


7 
而 且 合 于 1 兴 =1 的 赣 求 . 
再 稳 吉 仔 组 看 一 下 ,将 了 ; 用 成 分 向 基 的 样本 表示 下, 训 有 


7; = 让 (nze - lnzuo ) 会 Ing; 一 lngo， i = 1,2,°%,p,， 
其 中 
a = (He)’, i = 0,1,.,p 
这 样 就 有 
e = gi/go0, i= 1,2,.,p 
而 (1.12) 就 是 


b= gf (Da), 10,p, 
将 (1.12) 与 (1.4) 作 比较 ,可 见 (1.4) 是 由 算术 平均 得 来 的 ,而 
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(1.12) 是 以 成 分 资料 的 几何 平均 为 权 再 生成 估计 的 .后 者 利用 了 
逻辑 正 态 分布 的 特性 . 

(1.9) 式 的 估计 在 菜 种 意义 上 是 用 了 调和 平均 给 出 的 . 这 几 种 
不 河 的 估计 会 有 多 大 的 差别 ,下 面 我 们 用 一 个 数字 的 例子 给 以 说 
明 , 使 人 有 一 个 直观 的 印象 

下 面 是 甲 . 乙 两 个 医院 分 科 治 疗效 果 的 记录 ,年 份 是 1988 一 
1990 三 年 ,其 中 成 分 变量 共 五 个 , 即 治疗 效果 ， 


工 1 消 冶 百分比 
工 2 好 转 百 分 比 
2 无 效 百 分 比 
TA 死亡 站 分 比 


xz5 ”未 治疗 百分比 
从 这 组 数据 来 说 明 一 些 佑 计量 给 出 估计 的 差异 情况 ,详细 列 出 原 
始 记 录 就 太 长 了 ,这 里 扼要 地 对 原始 数据 给 出 描述 ， 着 重 于 估计 量 
的 数值 有 多 大 的 鞭 别 . 


训 1.1 两 医院 的 治疗 情况 [各 亦 量 的 年 均值 } 
甲 医 院 (‰) 乙 医院 (go) 


Ty 


043 














-09 ， 












玮 医院 (Yo) 
六 
D43 
D035 
045 


023 
021 
D19 











从 数据 来 看 ,成 分 确实 呈现 一 种 稳定 性 ,逐年 变化 总 的 来 说 不 是 很 
太 .上 述 数据 是 按 每 年 各 个 月 份 计算 后 ,再 算 年 度 的 月 平均 值 ,所 
以 已 经 是 如 工 了 的 资料 ,再 将 之 月 的 成 分 数据 到 对 数 ,再 求 出 均值 
和 方差 ,就 相当 于 观察 数据 用 y= Inx 所 得 的 样本 均值 和 方差 . 

为 了 便于 核实 ,就 用 表 1.1 的 数据 作为 原始 数据 ,把 甲 , 乙 两 
医院 的 资料 合并 ,传染 科 与 妇科 的 数据 是 相近 的 ,把 这 两 科 的 数据 
也 合并 ,这 样 就 有 5 个 变量 ,12 个 样本 ,算出 成 分 数据 ri 的 均值 、 
标准 差 的 数据 ; y; = Inz; 的 均值 .标准 差 的 数据 .结果 见 表 1.2， 
1. 陈 注意 我 们 是 用 ‰ 表示 的 )， 


表 1.* 癌 的 均值 .标准 差 
















标准 差 
5.979x 10-2 
0.3791 

.0.9480 

1.1219 

0.9053 





A 





它 雪 各 自 的 方差 、 协 方差 和 矩阵、 相关 矩阵 分 别 为 V(x)， 
Vy) ,Riz),R(y) ,相应 的 数值 是 
{2162.879 一 1359.045 一 508.288 —348.924 36.621 
1739.295 371.295 426.34l 一 1171.568 
V(x)= 191.720 163.674 -213.1441,， 
210.629 一 449.371 
1800.811 
1.000 一 0.701” —0.789** -0.517 0.19 
1.000 0.643° 0.704* -0.6652” 
R(x)}= 1.000 -0.814** -0.363 |， 
1.000 -0.730" 
1.000 | 
3.575x10-3 -1.35x10"2 -4.57x10-2 -2.06x10-2 3.45x10-3 
0.144 0,29 0.258 一 0.199 
Vi = 0.89 0.645 -0.280 
1.259 -0.816 
0.820 
1.000 -0.598” -0.774** -0.308 一 0.064 
1.000 0.644* 0.607” 一 0.581 
Rty)= 1.000 0.648” —0.313 
1.000 一 0.803 


.i 1.000 
* 表示 0.05 水 平 显著 , xx 表示 0.01 水 平 显著 (Ho 是 相关 系数 为 0) 


将 zi1; 2 ,Ts 中 哪 一 个 选 作 xo 去 求 jy 二 Inz;/Ax0, 显 热 绽 出 的 
y 均值 是 不 一 样 的 . 因此 所 得 的 千 计 值 就 不 同 , 另 一 点 可 注意 的 是 
妇科 和 0 年 . 甲 医院 的 xy=0, 这 是 观察 的 0, 理论 上 不 会 是 0, 而 且 
取 对 数 时 In0 = 一 就 无 法 处 理 ,因此 将 这 个 数据 用 1‰ 代 和 人 ,或 
当 眉 缺失 数据 处 理 , 用 最 小 二 乘 补 空 . 再 一 点 可 以 看 出 丸 {z) 与 
R(y) 的 显著 性 部 分 没有 差异 ,但 最 著 的 程度 有 差别 . 从 相关 系数 
的 正 负 号 来 看 ,也 是 有 意思 的 ,不 少 变 量 之 间 存 在 显著 的 正 相 关 . 
我 们 分 别 用 rs 作为 xo,z4 作为 zxo, 再 用 公式 (1.9) 和 (1.12) 
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给 出 佑 计 值 ,列表 与 zx; 的 算术 平均 值 比较 ,这 就 是 下 面 的 表 1.4. 


表 1,.4 不 局 估计 方法 的 合计 值 













算术 平均 
Inr /rst1.9) 
Inxri/ rst1. 12) 1000.01 
Inx,/xat 1.9) 124.04 |1000.002 
Ihr /ratl.12) 


久 这 是 用 1 去 右 全 部 和 有 得 到 的 . 


表 1,4 中 总 和 不 是 1000, 是 由 于 计算 数值 时 四 售 五 人 引起 的 
误差 ， 


$2. 期 望 值 检验 


对 于 成 分 数据 ,假定 总 体 分 布 是 加 法 还 辑 正 态 时 ,期 望 值 检验 
的 问题 可 以 看 成 是 正 态 总 体 期 望 值 的 检验 问题 ,因此 不 难 从 正 态 
总 体 的 一 些 检验 方法 直接 导出 有 关 成 分 向 量 期 望 值 检验 的 方法 . 

例如 ,成 分 向 量 ， 之 的 期 望 值 是 8= Ex , 它 的 对 数 变换 六 


p+1}Yx1 

=lnzizzo, i 二 1,2,…, 思 是 正 态 分 布 ,因此 要 检验 两 个 总 体 相 应 
的 z 的 期 望 值 相同 ,也 就 是 两 个 总 体 相应 的 y 的 期 望 值 相同 , 因 
为 y 与 x 之 间 是 双方 1-1 的 变换 ,问题 是 等 价 的 .这 样 ,就 不 用 对 
z 作 检验 ,只 消 将 z 数据 变换 为 y, 直接 对 y 用 正 态 分 布 的 一 些 结 
论 就 可 以 了 .很 明显 ,对 协 方差 矩阵 的 检验 也 是 如 此 ,这 样 考 虚 , 伺 
平成 分 数据 的 检验 问题 ,在 加 法 逐 辑 正 态 分 布 的 假定 下 ,就 很 好 解 
次 了 .实际 情况 并 非 如 此 ,我 们 先 用 举例 的 方式 列 出 有 关 用 正 态 结 
论 的 检验 方法 ,然后 再 进一步 讨论 为 什么 这 样 还 有 问题 , 

沿用 上 .一 节 的 记号 , 成 分 数据 的 样本 矩阵 于 加 工 为 了 ， 


nx 思 ,Y 的 各 行 独立 同 分 布 ,来 自 NN(p， 尖 ). 
例 2.1 已 知 协 方差 矩阵 ,要 检验 
Ho:p= pa; HI: pA 0: 
此 时 使 用 统计 量 
nz( 了 一 po) 于 (了 -po)， 了 = 1, (2.1) 
Ho 成 立时 , 它 的 分 布 是 X2( 户 )- 一 - 户 个 自由 度 的 X2 分布. 
例 2.2 未 知 协 方差 矩阵 > , 要 检验 
Ho:g= po Hi:p A pe0. 
此 时 使 用 T? 统计 量 ， 
T=n(n -1)(y -nu)S (5 — po), 1 
s = 六 (= 二 ij， ~ 22) 
当 n>p 时 ,(2.2) 给 出 T2 有 :Ho 成 立时 ， 
Rp 
(Cn -pT ~ Flp,n~p). 
例 2.3 多 总 体 的 均值 检验 . 
假定 是 来 自 总 体 N( pg , > 的 样本 矩阵， Y, 的 大 小 是 ni < 
,i 二 1,2,…, 记 ,2 未 知 , 此 时 要 检验 
Ho:m= p= "= ph (2.3) 
记 
下 
. 让 
¥ ={Y! Ya Ye), n= Dni, 
nx . . i=1 
了 = 二 Y 1， S = Y (1-1 )Y. 
于 是 检验 (2.3) 的 统计 量 是 


十 …* 十 
A = 3 5 Sa ， (2.4) 


4 的 分 布 是 A(p,n 一 R,&) ,这 一 分 布 的 表 可 以 在 文献 [1] 的 附录 
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中 找到 . 当 吉 =2 时 ,就 是 两 总 体 的 比较 ,此 时 {2.4) 相 应 的 4 的 分 
布 可 以 从 下 式 
1 -ww An -~ p 
VY p 
4 el-vA 
得 到 ,或 直接 使 用 统计 量 rut 


对 于 成 分 数据 向 量 z, 它 的 特殊 一 些 的 均值 检验 问题 是 有 关 
部 分 分 量 和 子 成 分 的 检验 ,现在 我 们 来 论述 这 类 问题 的 背景 和 它 
的 意义 . 

”首先 ,关于 部 分 分 量 的 检验 和 子 成 分 的 检验 是 不 同 的 ,但 又 是 
有 联系 的 . 关于 部 分 分 量 的 检验 ,例如 一 种 橡胶 , 它 是 由 天 然 橡胶 
以 及 其 他 各 种 人 工 合成 的 橡胶 配方 混 炼 而 成 的 ,人 们 关注 的 是 天 
然 橡胶 含量 的 百分比 是 否 是 规格 中 规定 的 量 , 这 时 要 检验 的 是 成 
分 中 某 些 分 量 是 否 为 特定 的 值 . % ， 表示 成 分 向 量 , 它 的 期 望 人 


1 


a 
Ex 记 为 8, 将 8 分 为 两 段 9 = 区 


~ Fl2p,2(n — p)) 


,要 检验 的 统计 问题 是 
(2) . 


Ho : By = fenyo (2.5) 
是 否 成 立 ,8(w 是 一 给 定 的 向 量 . 这 一 类 间 题 是 检验 部 分 分 量 问 
题 . 某 一 地 区 的 农 产 量 分 粮食 ,经济 , 油 料 等 各 种 类 型 , 随 着 经 济 的 
发 展 ,粮食 作物 中 大 米 .小麦 , 茧 类 等 后 的 比例 是 否 有 变化 ,这 时 整 
个 农作物 的 产值 会 变化 ,经 济 作 物 与 粮食 .油料 等 作物 的 比例 会 变 
化 ,粮食 作物 的 总 产量 也 会 变化 ,我 们 关心 的 是 粮食 作物 中 大 米 、 
小 麦苗 类 等 比例 是 否 有 变化 . 如 果 用 x 表示 农作物 中 各 种 作物 
的 播种 面积 所 占 的 比例 ,8= Ex ,于 是 9 中 的 一 部 分 设 为 9(1) 就 是 
粮食 作物 播种 面积 的 比例 ,但 我 们 并 不 关注 8 这 个 部 分 是 否 有 
变化 ,而 是 关心 Gu) 中 各 成 分 的 相对 比例 一 一 子 成 分 
Sb = Ovtlb0))" (2.6) 
是 否 有 变化 ,因此 要 检验 的 问题 是 
Ho: So = Say, (2.7) 
-104 ， 


其 中 So 是 一 指定 的 常数 向 量 . 很 明显 ,(2.7) 相 应 的 问题 ,仍然 
是 一 个 成 分 向 量 的 均值 检验 ,注意 到 如 法 罗 辑 正 态 分 布 的 性 质 , 它 
的 子 成 分 仍然 是 加 法 多 辑 正 态 分 布 , 因 此 这 一 类 的 检验 问题 仍然 
与 竺 汽 例 2.1, 例 2.2, 例 2.3 的 情形 ,自然 就 可 以 解决 .但 是 人 .5) 
的 问题 是 不 同 的 , 它 不 能 化 成 一 个 子 成 分 的 问题 ,因为 Bw) 与 90 
可 以 不 同 ,但 Sn = 和 iD 人 BOD) 与 SS 全 三 的 ) (8 的 ) 可 以 是 
相同 的 . 因此 (2.5) 成 立时 ,一 定 有 (2.7) ;然而 (2,.7) 成 立时 ,不 一 
定 有 (2.5)， ， 

如 果 & 2 中 有 一 个 成 分 不 变 ,而 且 这 一 情况 是 已 知 的 , 则 有 办 
法 把 它 作 为 xo 来 处 理 ， 这 时 就 相当 于 对 y 的 总 体 N(y， 2 只 检 
验 wx 的 一 部 分 , 即 

_ 2? 
(2) 


Ho : po) = Hew 
是 否 成 立 , xiyo 是 一 固定 的 向 量 . 这 一 类 问题 在 一 般 多 元 分 析 的 
书 中 已 有 讨论 ,这 里 就 不 进行 这 方面 的 论述 .下 面 和 将 这 个 问题 转换 
为 乘法 逻辑 正 态 分 布 的 检验 问题 ， 
在 第 二 章 中 ， 我 们 讨论 了 乘法 凶 辑 正 态 分 布 ， 即 对 成 分 向量 = 
=(zoyzizi 假定 


一 一 nlz /01 一 Ds) 1 二 1,2,…,p 

是 正 态 分 布 .因此 要 检验 某 一 段 分量 的 期 望 值 是 将 为 指定 的 向 量 
时 ,总 可 以 认为 它 是 (zxo,… ,zx ) 组 成 的 ,因此 从 鞠 法 有 逻辑 正 态 分 
布 来 看 ,就 相当 于 检验 (yl,…, x) 是 否 来 自 期 望 值 向 量 为 指定 向 
量 的 总 体 ,这 就 还 原 为 一 个 正 态 总 体 的 检验 问题 .然而 困难 的 是 ， 
对 8= Ex 的 一 个 命题 并 不 能 直接 表示 为 对 Fy 的 一 个 命 古 ,这 一 
点 我 们 从 上 节 的 参数 估计 中 已 请 楚 地 看 到 了 . 

对 乘法 逻 辑 正 态 分 布 , 已 知 "一 NInp,2), 注 意 此 时 y 与 > 
的 关系 式 是 


只 癌 
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-ex/[TTG +e)] , i=1,2,,p, 
j=1 
zo =[IT 0+ 0) 


或 a 
yi = lnzx; - In(1 - > zi), t = 1,2,.…,p - 
j=0 

因此 ,从 

Ex; =E(e [I Orte))]) ,i=1,2,,p, 

1=1 
Exo -EI[T +o) 
j= 

或 


Ey: = Elnx; — Eln(1 — Sx) , i=1,2,.…,p. 
都 只 能 得 到 9= Ez 与 = Ey 之 闻 的 近似 关系 式 ,并 不 能 直接 给 
出 一 个 完全 等 价 的 命题 . 

从 这 个 讨论 可 以 着 出 ,加 法 逻辑 正太 分布 ,乘法 逻辑 正 态 分 布 
对 于 处 理 变换 后 的 y 而 言 ,y 的 期 望 协 差 阵 都 已 和 正 态 相 同 ,但 
从 要 讨论 的 成 分 向 量 x 的 期 望 值 8= Ez 与 协 方 益 矩 阵 光 而 言 , 变 
换 后 的 y 并 不 能 给 出 明确 而 有 效 的 外 理 方 法 ,这 是 成 分 向 量 统 计 
分 析 的 困难 之 处 ， 


$ 3. 主 分 量 分 析 、 典 型 相关 分 析 


注意 到 加 法 逻辑 正 态 分 布 的 特性 是 处 理 成 分 向 量 经 变换 的 正 
态 变 量 y, 因 起 对 于 y 可 以 进行 主 分 量 分 析 ; 这 与 通常 正 态 分 布 中 
的 主 分 量 分 析 没 有 慎 么 不 同 , 这 里 我 们 利用 加 法 逻辑 正 态 的 特性 ， 
十 人 成 分 向 量 z 的 男 一 种 变换 ,使 它 在 处 理 主 分 量 分 析 时 带 来 一 
些 方便 ， 
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7 
设 z= 是 成 分 向 量 ， 
Ap 
Int zi/ ro) 
一 【一 站 | ~ N(x, > ). 
ln(C x ro) 
令 
in(zo/g(x)) 
z= nr lng(r) = : » 
In{xp/ ECT)) 
其 中 
g(r) = (Tz) Zi， 
因此 
1 v a ， 
= (TF )ine sQhz . (3.1) 


注意 到 (1 一 地]11 )1=0, 因 此 Q llnzo=0, 于 是 


z= Qlnr ~ Qinr = Qn( r/o0) = al ， 


因此 z 也 是 正 态 分 布 ,但 是 它 是 退化 的 正 态 分 布 ,z 的 协 方差 矩阵 
,的 行列 式 是 0. 从 上 述 青 达 式 可 知 z=9.y, 因 此 z 一 N(B, jp， 
9 0 ) ,其 中 

1 / 


日 一 ? 1 
hs 
由 于 本 身 的 定义 对 于 成 分 向 量 x 中 各 个 坐标 分 量具 有 对 称 性 ， 
因此 对 它 进 行 主 分 量 分 析 就 更 能 反映 成 分 的 特性 - 
容易 证 明 下 面 > 与 z 的 相互 表示 的 公式 ,这 就 留 作 练 避 ., 记 





+: 07 * 


F ={(-1 五 )， (3.2) 


pxtpt+1) 


于 是 





一 1 1 
+ FC(FF')t= F'(FF')! = (有 
本 F'(FF)'= FFF) 加 pp p+1 





1 1 
p=*1 -一 0 1 Tn ” 一 
1, 一 工 工 9 
p+1 
(3.3) 
并 且 有 
z= Fiy, v= Fe. (3.4) 


现在 来 讨论 = 的 主 分 时 ,也 就 是 对 z 的 协 方差 矩阵 
>， ， = Var(z) = Var(F'y)= Ft+ DF* 
进行 谱 分 解 . 
设 1 六 1 之 … 和 之 和 + 是 症 。 的 pp 二 1 个 特征 根 ,由 于 FF! 的 秩 
是 思 , 因 此 可 以 断定 My+1=0, 实 味 上 只 有 pp 个 主 分 量 . 记 非 零 特 
征 根 4; 相应 的 特征 向 基 为 1; ,于 是 有 下 列 命 题 . 
命题 3.4 设 i; 是 1; 关 0 相应 的 特征 向 量 , 则 
Lt;=0. (3.5) 
证 明 念 ) 汪 = 也 二 人 Varfimnr )Qi;; 由 于 QQ1=0, 因 此 
Ai lt = LQVar(lnz )Qt: =0， 
今 4; 隆 0, 就 得 1t,=0 . 
命题 3.2 设 二 为 4, 关 0 相应 的 特征 向 量 , 则 它 相 应 的 主 分 
量 c; 有 表达 式 


ci = tihnx {3.6) 
证 明 这 是 因为 
ct 一人 mr 
ol 1 ， 
= 并 -11 juz 
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pe 


= tilnzx. 

从 (3.5) 及 (3.6) 就 知道 ,inz 的 对 比 tilnzx 就 是 zx 的 主 分 量 , 也 就 

是 成 分 向 量 x 的 对 数 对 比 .这 些 主 分 量 也 都 是 正 态 分 布 ,它们 也 
都 是 y 的 线性 函数 ， 

Tl) 

”从 上 面 的 讨论 ,利用 成 分 向 量 的 样本 短 阵 ”X= | : 


- 
Ttn) 





Inzao) 


加 工 成 InX = (lnxry)= ,再 形成 








Inxtn)y 


= (InX)Q, 


mxtp+1) 
这 人 


求 特征 要 ,特征 向 量 , 以 特 在 向 为 于 .就 求 得 各 个 主 分 量 

对 于 成 分 向 量 x , 当 zr 苯 从 加 法 逻辑 正 态 分 布 时 ,也 可 以 考 
虑 它 的 对 数 lnz 分 两 组 或 多 组 时 的 典型 相关 分 析 , 如 直接 对 y 讨 
论 ,这 时 ze 的 地 位 有 些 特殊 ,缺乏 各 分 量 之 间 的 对 称 性 ,所 以 我 
们 还 是 对 z 进行 讨论 ,zx 对 于 各 个 分 量 是 完全 对 称 的 . 

将 = 分 成 两 组 ， 


] 正二 
z= 90|- anz = [on , 
k 


然后 对 
S$. = 








2[2) Qnz p— 
其 中 
by = (ln p ' p+il p+ 了 ) ， 
0 ={- pil b+ 2 


现在 利用 判别 信息 量 来 导出 两 个 随机 向 基 间 的 相关 性 度量 ， 
我 们 先导 出 非 退 化 正 态 随机 向 量 的 相关 性 度量 ,然后 将 它 用 于 退 
化 正 态 分 布 .相关 性 度量 用 联合 密度 p(xz,y) 与 独立 时 边缘 密度 
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的 绞 积 f(x)ge(ly) 的 判别 信息 量 来 反映 ,其 中 

f(z) = plzsy)dy, gCy) = [pr,y)dz, 
判别 信息 基 是 

一 DZ) 
I(x,y) = [pc ,wh RP ddy . (3.7} 

如 果 
“| 加 2 

5 5 





则 自然 有 
z ~ N(p, DD ) yy N(p, 了). 

用 (3.7) 式 就 可 以 算出 
>, | Er 
5 3 (8) 


+ F(x Er) D(x Er) 





下 全) -|- 方 (2 ~ Er'y — Ey) 


+ 让 (y - Ey) 5, (y - Ey) 




















2 2 
一 加 > 5 | 
> 2 
40) 5 BE. 
47- DD 5 -| 
因此 相关 性 度量 就 与 矩阵 


1 


1-4 |] 1 一 1 人 一 
2 (3.8) 
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的 特征 根 4; 有关, 这 些 特征 根 的 2 就 是 典型 相关 系数 .对 于 退化 
的 正 态 分 布 ,只 要 将 (3.,8) 中 的 首 和 矩阵 疏 成 “+ "号 道 , 即 考虑 矩阵 
地 + 1 飞 十 让 
忆 DD (3.9) 
就 可 以 了 . 这 样 我 们 就 导 册 了 两 组 成 分 分 量 之 间 的 典 理 相关 系数 ， 
它 就 是 矩阵 


(QVQ2) $ (0; vA) (QI VQ) (QIVQ2)( Qi VQ2 YS 
的 非 零 特征 根 , 其 中 





V = Varfinzr) ， 
从 成分 向 量 = 的 祥 本 入 降 , 必 ,， 册 发 ,加 工 记 Z,，- 
(InX)Q ,将 Z 相应 分 块 ,分 成 
) ， 


Z =( ZI Z2 
nxtpt+1) mtrt ly np 


再 加 工 成 
Ln =21(h, -311 
La =Z1(h -1 )z = La, 
La =Z4(h -LL )z, 

求 


L$LaLiL 或 L 共 LaLihiLwL 直 
的 非 堆 特征 根 , 就 能 得 典型 相关 系数 ,典型 变量 的 求法 就 与 正 态 时 
非 退 化 的 情形 相仿, 这 里 就 不 再 叙述 了 . 


$4. 子 成 分 的 独立 性 


从 成 分 向 量 + 的 分 布 是 加 法 逻辑 正 态 分 布 ,就 知道 它 的 任 一 
子 成 分 向 量 的 分 布 也 是 加 法 逻辑 正 态 .因为 子 成 分 的 任 一 对 数 对 
比 一 定 是 z 的 一 个 对 数 对 比 . 
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现在 来 讨论 子 成 分 的 独立 性 检验 .将 成 分 向 量 分 成 两 月 ,= 
9] ,1 + py == 思 +1, 先 讨论 两 个 于 成分 


{2) 





Se = zollrey) l,i = 1,2, (4.1) 
的 独立 性 ， 
引 理 4.1 当 刀 关 2 时 ,xz 服从 加 法 逻辑 正 态 分 布 , 则 有 So) 
与 $ 轨 相互 独立 的 充分 必要 条 侍 是 | 
Vi | 


VizP2 = 0,¥Y = ， 
PiVizP2 [人 Vy 


(4.2) 
其 中 


P = 也 -二 = 1,2,V = Ver(lnr). 

证 明 ”Su 与 Sw 独立 的 充分 必要 条 件 是 向 量 InSww 与 
InStzy 相 互 独 立 ,这 也 等 价 于 PilnSo) 与 PylnSez) 相 互 独立 .由 于 
PilnS) 的 正 态 性 ,独立 的 充分 必要 条 件 是 不 相关 . 今 

0 = CovtPilInSw, PInSey) = PiCovt nS ,ln Sse) ) Pb,, 
注意 到 InSi;)= tnre;) — lin(1’ (py) 因此 有 

PlnSty = Pitlnztpb — lln(l'zey)) = Pilnrtn， 

于 是 就 得 到 {4.2).， 

现在 要 将 (4.2) 式 用 y= (一 1 五 )nz 的 协 方差 矩阵 于 表示 出 
来 ,因此 要 将 忆 分 块 , 注 意 到 xz 在 y 中 的 特殊 位 置 ， 这 样 必须 分 
几 种 情形 和 逐一 的 讨论 - 


将 工分 成 上 段 ,x = AEA ~ "TY ,Tj 是 pr 维 向 量 ， 
之 2, 且 守 加 = 户 +1, 相 应 应 的 


Vu Ya “7 Vie| pi 
: ” (4.3) 


Vartin x)= Y = 
: pr ， 








Ve Vez ~ Ve 


记 Pi=1 -六 1 ,lk 





当 ;天 1 时 , PiinSly = Pilnroy = Pi(lnztn ~ 1nzo) 
= Payen. 
注意 ,y= (一 二 了 )inz 也 与 x 相应 的 记 段 ,但 yt) 是 p11 一 1 维 
3 二 (yD (01 sy 00),Y 相应 的 协 方差 矩阵 也 相应 分 成 六 x 
上 的 分 据 形 式 , 妈 
3 > YY 2 pi~1 


四 p2 : 
‘2, 2 **" > pr 
当 i= 
PilnSey = Pilnzroy = Pillnzey - linxro) 


0 piil 
-pl |=| ， — pilll 0) 
有 了 这些 准备, 就 可 以 用 引 更 4 4.1 来 给 出 肘 吕 表示 的 充分 必 
要 条 件 . 
定理 4.1 设 成 分 向 量 > 眼 从 加 法 授 辑 正 态 分 布 ， 相应 
=( 一 1] jinzx 一 Ntp, 安 ), 则 将 分 威 记 zt， 
有 如 下 的 结论 : 
当天 1,j 天 工时 ,SS 独立 名 PP =0 
当 i 关 1,7 = 工时 ,3 ,So) 独立 全 已 >) = 
i 23 
这 一 证 明 是 简单 的 ,8 因为 当 i 天 1,; 关 1 时 
0 =Cov(PilnSe) ,PlnS0)) 


=Cov(Pyey, Py0)) = Pi 27,P; 





(4.5) 


当 i 天 1 时， 
0 =Cov( PinS.) ,PilnSen) 
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0 
=Cov|Poc,P, | ,| 
Yl) 
1 1 
=P: Dl- pi prt ) 
即 | 
| 1 [二 一 上 
0 = (P 了 ， 1 pi) PD Pi a tin ) 
上 式 成 立 的 充分 必要 条 件 是 P;>2, =0. 
从 定理 4.1 知道 ,要 检验 子 成 分 的 独立 性 ,就 引出 正 态 总 体 协 
方 盖 阵 鱼 构 的 假设 检验 问题 . 现在 我 们 从 (4.5) 导 出 相应 的 统计 
量 . 
Pi 芝 jP;=0, 表 示 Po 与 Po) 不 相关 ,由 于 yj) ,yi 是正 
态 变量 ,也 就 是 Piy(a 与 Piytj) 相 互 独立 .这 也 就 是 Piytjy 与 Piytj) 
相应 的 典型 相关 系数 全 为 和 .注意 到 样本 相应 的 典型 相关 系数 可 
以 y 的 样本 协 方 差 阵 的 分 块 表示 后 的 矩阵 来 导出 ,这 样 就 可 以 获 
得 有 关 的 统计 量 ， 
将 y 的 样本 矩阵 Y.v* 也 分 块 写 出 ,于 是 


本 四 1 - 1 
2 一 一 


-p 
= pLs), 
其 中 
Ly= Yi -11)Y,, 
Y= (YY “ Y) 
Pi—l pp: ** pr. 


桩 本 的 典型 相关 系数 的 平方 是 矩阵 商 ; 的 特征 根 , 到 , = LL; 
浒 相关 系数 的 平方 是 矩阵 
(PLiP)* PoP; (PLP))’ PLP: 
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的 特征 根 . 当 Pa 与 Piy0j) 相 二 独立 时 ,所 有 典型 相关 系数 均 为 
0, 因 此 它们 的 平方 也 是 0, 它 的 平方 和 也 是 0, 这 就 导出 
£ = TOCPLPi) (PiLP CPL ,Pi) PaP: 

是 一 个 合适 的 检验 统计 量 . ， 

注意 到 P; > =0 也 就 是 Po 与 yoy 独 立 , 因 此 相应 的 统计 
量 是 

t = tr(P;LaP;)! (PLa} LiiLP:;. 

它们 精确 分 布 并 不 好 求 ,但 它们 的 渐 近 分 布 是 可 以 得 到 的 ,这 样 检 
验 的 问题 也 就 解 快 了 . 


$5. 回归 分 析 


成 分 数据 的 回归 分 析 有 两 类 :一 类 是 以 成 分 向 量 为 因 变 量 , 考 
典 其 余 的 变量 为 自 变 量 ; 一 类 是 以 成 分 向 量 为 自 变量 ,以 其 他 变革 
为 因 变 量 ,现在 分 别 讨论 如 下 ， 

以 成 分 向 量 为 因 变 量 的 回归 问题 ,就 是 考虑 别 的 变量 对 成 分 
的 影响 ,例如 家 庭 的 收入 对 家 庭 消费 的 各 种 成 分 会 有 影响 ,家 庭 消 
费 可 以 分 为 食品 ,衣着 、 交 际 .文化 教育 .其 他 等 项 ,很 明显 ,收入 不 
同时 ,上 述 成 分 占 的 比例 是 不 同 的 ,因此 这 一 类 回归 问题 是 有 意义 
的 ,一 般 说 来 , 它 是 多 对 凶 的 回归 . 

直接 将 成 分 作为 因 变 量 来 建立 回归 方程 ,由 于 成 分 x; 的 值 在 
从 ,1) 区 间 内 ,对 回归 应 数 的 选择 带 来 很 多 困难 ,因此 选用 y= 


ni=1,2,.,p 作为 因 变 量 有 很 多 方便 ,一 是 y; 的 值 可 以 在 


《一 ,co) 内 变化 ,对 函数 的 选择 带 来 方便 ;二 是 y; 可 以 认为 是 服 
从 正 态 分 布 的 ,只 要 成 分 向 量 zx 是 遵从 加 法 逻辑 正 态 就 可 以 了 . 
这 样 用 y; 作 因 变量 就 与 普通 的 多 元 回归 没有 什么 区 别 . 

值得 注意 的 是 一 类 由 基 向 量 引 导 的 回归 问题 .例如 ,一 个 家 庭 
有 各 种 各 样 的 收入 ,也 有 各 种 各 样 的 支出 ,因此 收 人 与 支出 是 两 个 
随机 癌 量 ,考虑 到 它们 的 分 量 都 不 是 负 的 ,因此 用 联合 对 数 正 态 来 
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描述 还 是 合适 的 .我 们 用 w 向 量 描述 各 种 收入 ,用 w 向 量 措 述 各 
种 支出 ,它们 的 联合 分 布 为 


gq fln a a fu {iw 
p+ i “)- 网 四 | 
由 ww 导出 支出 的 成 分 向 量 zx= wftow) 1, 相 应 的 y= 
lnfzrixzro)r=1,2…m) 户 是 正 态 分 布 . 
此 时 从 lna ,lnw 可 以 导出 lna 与 y 的 联合 分 布 , 然 后 利用 条 
件 期 望 和 条 件 方 差 , 求 出 相应 回归 方程 的 函数 形式 与 加 权 最 小 二 
乘 的 权 年 阵 , 下 面 我 们 就 来 推导 这 些 公式 . 


的 和 
注意 到 w= | :| , 且 开 = w(low) 1， 


Wp 
yy =n(z/r0) = (ww) Two( Nw) 1) 
=Ine; ~ Inwo, 1 = 1,2,.…,p. 
因此 
Jy1 


4 一 = {-1 T, nw A Flinw, 








Vp 
于 是 

Ey = FP, ,Var(y) = FPF, 

Cov(y,lnu) =CovC Flne ,nu) 
= Fn. 
这 样 我 们 就 得 到 y 对 的 条 件 期 望 和 条 忻 方 差 的 公式 (直接 引用 
正 态 分 布 的 结论 ) 是 : 
Eiylu|l=Ely| lnul 

= Ey + Cov(y,lnu)}Var(tlnu) (lnu — 0.) 

= + FONA(Inu 一 日 ) 

= 下 FE ino | nw!}, 
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Varly | wl}=Varlyl lnul= Var{fFine | lnu! 
= FVar!llnw lin 人 
=F(f, — Od)F. 
所 以 成 分 向量 z 对 的 回归 方程 ,用 y 来 表示 时 , 它 是 ww 的 对 数 
的 线性 函数 , 它 的 权 和 矩阵 也 可 以 通过 上 述 会 式 求 得 ， 

现在 来 讨论 第 二 类 问题 , 它 的 表达 形式 自然 会 与 混 料 设计 的 
内 容 有 联系 ,在 这 里 ,我 们 先 不 去 讨论 设计 问题 ,只 讨论 回归 问题 
及 相关 性 的 度量 .用 成 分 向 量 x 作为 自 恋 量 ,与 用 它 的 变换 % = 
lnzizzoi=1,2,…, 力 作为 自 变量 相 比 ,后 者 有 很 多 方便 ,我 们 用 
tz 表示 问题 中 要 考虑 的 因 变 量 , 因 此 可 以 从 这 样 的 前 提出 发 ,就 是 
xz 与 y 是 联合 正 访 分 布 的 ,这 样 对 y 的 回归 函数 的 形式 可 以 从 
条 件 期 望 的 表达 式 中 得 到 .因此 ,后 上 一 个 类 型 的 问题 相仿 , # 是 
y 的 线性 函数 ,也 就 是 说 ,x 是 成 分 向 量 上 对 数 的 线性 函数 . 

从 这 个 角度 来 看 混 料 试验 的 设计 与 分 析 , 对 于 优良 设计 的 选 
择 , 可 以 有 男 一 种 考虑 方法 ,下 面 用 一 个 例子 来 说 明 . 

例 5.1 混 料 试验 问题 的 简单 情形 . 

在 橡胶 工艺 中 ,要 设计 生产 的 橡胶 在 性 能 上 达到 基 种 要 求 , 就 
需要 考 上 处 配方 ,配方 是 天 然 胶 用 多 少 { 用 百分比 措 述 ), 人 人 工 胶 用 多 
少 ,填充 剂 用 多少 ,还 有 工艺 水 平 的 选择 等 等 ,原材料 各 种 成 分 的 
比例 ,就 是 很 自然 的 一 个 成 分 向 基 ,我 们 用 & 表示 某 个 性 能 ,zo， 
ZX1，,"… ,Tp 表示 成 分 ,于 是 有 关系 式 : 


ua 一 如 十 Vln teya = 1,2,.…,n, 
20 


和 且 QO< x 所 1,i = 0,1,2,.…,p，, (5.1) 


De le 
i 三 六 


其 中 
El 
Ee=|:|,E = 0,Vare) = of, 
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《5,1) 式 相应 的 设计 和 矩阵 


因此 


HH = 


] ” 


Inz rp) 
x 3S nr 0 > Inzop 
w=1 =1 
2 Inxop 


| > {lnza) (Inzs;) 








> Inzxop 
a=1 


注意 到 有 H 的 宕 达 式 中 内 与 试验 次 数 与 成 分 向 量 n 个 点 的 选 
择 有 关 . 从 试验 设计 的 优良 性 来 看 ,有 DD 最 优 .4 最 优 与 4 最 优 这 
些 准 则 , 而 这 些 淮 知 的 优化 目标 都 是 五 五 的 函数 . 

DD 最 优 :要 求 HF 的 行列 式 | 五 五 | 最大; 

A 最 优 :要 求 tr( 百 五 ) -1 达到 最 小 ; 

A 最 优 : 要 求 五 互 的 最 小 特征 根 达 到 最 大 .注意 到 
tr(HH)-! 是 HE 的 道 答 阵 的 特征 根 之 和 ,用 41 之 X42 之 … 汪 4+2 
表示 HE 的 特征 根 , 则 有 


+2 +2 
ur(HH)! = Sa > (p+ 27( Da) 
i=} i=1 


一 (六 二 2220trH HH) 1 
当 nn 给 定 后 tr 五 尽 可 能 大 ,也 就 是 使 rr( 五 )-! 的 下 确 界 尽 林 
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能 小 ,这样 ,优良 设计 的 选择 都 与 记 五 的 特征 报 有 关 ,而 且 者 要 求 
HH 在 基 种 意义 下 尽 可 能 地 大”. 注意 到 HH 是 向 量 的 内 积 算 
阵 , | ET 反映 的 是 由 这 户 +2 个 x 维 向 量 形成 的 多 面体 体积 ， 
trH H 是 这 p+2 个 向 量 的 名 个 长 度 平 方 和 ,HH 的 最 小 特征 根 反 
映 的 是 “ 椭 球 "的 短 轴 ,所 以 优良 设计 的 几何 意义 是 明显 的 ,要 求 
p+2 个 向 量 尽 可 能 “分 散 ”. 

现在 我 们 看 一 个 特殊 的 优良 设计 的 解 , 这 个 求解 的 方法 对 我 
们 具体 处 理 设计 癌 题 是 有 启发 的 . 设 马 做 了 am 次 试验 ,相应 的 设计 - 
手 阵 H 已 知 ,现在 要 添加 一 个 试验 , 问 这 个 试验 点 的 成 分 向 量 该 
如 何 选 择 ? 我 们 用 晴 ; 表示 添加 一 次 试验 后 形成 的 设计 和 矩阵 ,于 
是 HH 与 H., 的 关系 可 以 表示 成 ; 


_ A H 
Hr = | oj | ey] 
其 中 zf ,…' ,x 就 是 待 亿 的 成 分 向 量 z* . 
如 果 考 虚 DD 最 扰 , 则 选 zx* 使 | 9 瓦 。 | 达到 最 大 .此 时 


| | ， | 
HH =|H 
Inzx 1 (nx*)y 
, 1 a 
-ar+| .| ne 了 
于 是 


LOA ja ne 


1 
Inr* 





1+ {1 (Inr* ora ' .| IH'H|, 
Inzx 
所 以 只 要 选 x "使 
站 = (1 (Cine YH)" 加 (5.2) 
ne 
达到 最 大 ,x * 就 是 一 个 优良 的 设计 .这 是 一 个 有 约束 条 件 的 极 值 


问题 ,为 了 能 比较 请 想 看 出 对 "的 依 粮 , 记 (HH)-!= (。 小， 
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C=tcjy), 于 是 
f=at+2b lnr” +(inz Clnzr 


= +2Y， blnz? + py cy(lnz? (nrc? ), 
t= 1 二 自 
约束 条 件 是 zy 之 0,f = 0,1,…, 思 ,了 zx} = 1 用 拉 氏 乘 子 法 ， 


得 r 
2Cf—- (a xr? -1)) 








2x7 
-25 上 A= 0.1.. 
=2p, x +2%a zr ln A,t 0,1, sp. 
1 
TO 
让 上 式 汐 0, 用 秆 阵 的 形式 写 出 , 记 (x*)1! = | : |, 则 有 方程 
1 
Tp 
1 
zx0 9 bo ro 
。 Clnz ”= 1 一 : 
0 工 bo/x 2 (3.3) 


xz? 安 0,1 = 0.1,2，p xs = 1. 
于 


很 明显 ,(5.3) 是 一 个 非 线 性 方程 组 , 它 的 解 无 法 用 显 式 表示 ,但 可 
以 用 选 代 法 求解 . 

在 (5.3) 式 中 ,约束 条 件 给 求解 带 来 了 一 些 麻烦 ,注意 到 对 y; 
=ln(zixzo) 而 言 ,不 存在 约 东 条件 ,一 旦 y; 的 值 确定 了 ,从 y; 与 


In(z; /zo) 的 关系 式 和 了 zx = 1 就 可 以 直接 求 出 x 的 什 , 因 
0 
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一 wz 人 1 十 > 一 1,2,",p，, 
i=1 

















(5.4) 
xo = 1/(1+ Ye). 
z=| 
于 是 ,(5.1) 式 可 以 改 为 
ta 二 十 Sb 十 Eu a 一 于 2 
i=] 
El (5.5) 
Ese, = 0,e = | :| ,Varte) =.oT,, 
En 
而 设计 矩阵 
Si 
y= Ev sy |， 
dn 
i = 1,2,*,p 
3 的 值 可 以 在 ( 一品 ,oo) 内 选取 .而 
1 
HH =| | (1 yi y,) 
yp 
hn yi 1 yp 1 
on | n 2] 
: yy ny YY) 
1 yy 
其 中 
.. -1 
Y, = Cy yp),y = Yi. 


这 就 是 如 同 普通 的 回归 问题 一 样 ,对 y 的 选择 就 容易 得 多 . 这 一 
点 正 是 加 法 逻辑 正 态 的 方便 之 处 ,但 这 一 方法 本 身 显然 在 回归 、 试 
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验 设计 中 对 其 他 分 布 也 是 适用 的 ， 
$6. 判别 分 析 


由 于 zx 遭 从 加 法 逮 辑 正 态 分 布 时 ,处 理 它 在 变换 后 的 % = 
(ziyzo) ,i 一 1,2,…, 力 ,可 以 完全 按照 正 态 的 情形 进行 ,所 以 关 
别 分 析 也 就 简单 了 ,无 论 是 两 总 体 或 多 总 体 的 情况 ,都 可 沿用 正太 
的 结果 .在 这 里 我 们 用 判别 信息 量 来 导出 判别 函数 . 两 个 密度 之 加 
的 虐 离 可 以 有 两 逢 度量 方法 , 记 bi;(z), 思 (z) 是 两 个 密度 函数 ， 
网 
Hpt(z),pa(z)) = pr()In DE 
J (pC2), p22)) = ICpa(z),pa(z)) 
+ I(p2a(x), p(x)), (6.2) 
都 是 非 负 的 ,是 一 定 意义 下 度量 pr(z)、pa( xz) 之 问 差距 的 量 .很 
朋 显 ,T(pi(x), pz2(x)) 对 于 Di(z) ptzl) 是 不 对 称 的 ,而 
J(p1(z),p2(z)) 是 对 称 的 .现在 将 它 用 于 天 个 正 态 总 体 ,着 导出 


相应 的 表达 式 . 设 pi(z) 是 N(p1,201),pz(z) 是 N[(p2,27,)， 
pp px 
于 是 





dz， 《6.1) 


力 久 他) 
pti)d™ 





Tpi(x), pa(z)) = |pi(x)In 





之 
-所 | EL (x ~ pa) DI (x p2) 
2 "| + 产 2 2 ，， 空 2 


— (zx— py Di (zx 一 Al) 


| 二; 
| 





1 1 -上 。 
三 本 In -去 + 方 t2。 E(x — pa)(lx - pe2), 
=- 122 - 


ET EG Tee ee HE 3 EE HE i 


注意 此 时 的 求 期 望 玉 是 对 p(xz) 求 的 ,因此 - 
上 kz 一 Pa 并 — p22) = 2 + pt — Pa ~ pe2). 





这 样 就 求 得 
1pi(r), palr)) 
1 | 二 ,| p 
= 2ln S: 2 
[2 





+ 六 2 ,+ (ul pa) Cp — £12) ) 
(6.3) 





= Bs +t> Si 
2 [| 2 1 


tp 一 pa Dy (ul 一 pa) 一 中 


同 理 有 
2 
Tilpalry, pir)) = 二 | 十 cr2 >, 
| 二,| 
十 《RE — p2) DY Cp — £2) 一 中 
(6.4) 
于 是 


p(x), p22) =F (u( D7, + D5,) 
+ (pt p2) DT Cp — p2) 


+ (gL 一 po 六 > (Cp 一 12) ) -pb. 
二 (6.5) 
容易 看 出 (pi(zx), pa(z)) 是 以 pi(z) 为 比较 基准 ,看 ps(z) 仿 
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高 p(x) 有 多 远 , 同 样 地 ,pz(r) ,pi(z)) 是 以 po(r) 为 基准 ， 
看 pi(z) 人 偏离 pz(x) 有 多 远 . 

现在 来 求 出 相应 的 判别 浅 数 .假定 1 ,2; 之 1,; 2 都 是 已 知 
的 ,如 时 它们 是 未 知 的 ,此 时 一 定 有 训练 样本 ,从 训练 样本 得 到 相 
应 和 属 计 ,因此 上 述 参 数 用 它们 的 和 计量 代替 ,自然 也 可 以 认为 是 已 
知 的 . 我 们 这 里 处 理 后 一 种 情况 ,假定 有 ni 个 样本 来 自 NN(p1， 
2 了 个 样本 来 自 正 态 总 体 N{ pe, 272); 相 应 的 估计 用 yl， 


闻 入 (2, 六 分别 表示 ,又 已 知 一 个 新 的 样本 ,局 y 应 归 
人 哪 一 类 ,是 归 人 N (p21) 还 是 NN 人 jo, 535)? 将 yy 添加 到 
N(p1, 忆 ) 的 样本 中 去 ,得 到 p1, 3) 的 新 的 估计 ;: 


Pi = = ty D+) 





本 1 | 一 一 四 n? 
2 = 记 (1 5, thy FDNy— Fy) 二 | 


如 1 #1 _ 一 一 六 





现在 用 yD 中 代 (6.3) 中 的 At 1, 用 Ri1， 心 代 (6.3) 中 
ra 和 22, 就 可 求 出 相应 的 距离 


m2 + wo > 


下 (Ne 271))= 去 b> | 
(1) 





+ (gi 一 FY Dy (a 一 了 6D) 一 所 





注意 到 x1 一 y= 了 (GD) 又 


[>, |=(#) 
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nl 一 — 2 
ft 十 nl+t+ > 一 F000(y 一 y 0 | 


a re me en eh ee i ee he 


NP eT mo amp me ee 





= |, ) (+i - yy 
x Dy - 700)) 
因此 
[2 


办 ~ 
好 上 好 1 一 SI | 
-人 (2 (1+ Aarti(y 3 (0) Zly 了 0D) ? 











-1 
5 = (S #1 ) 
一 1 一 而 之 1 + RT + I Yty — yy) 





+ ln-1 ~l 一 _- 二 
= (D+ Fv (y— ye) 


Hl1 


~ > 2， 














其 中 
因此 
人 -1 之 4 型 二 十 1 1 
ro 270 = p+ ol(v 1)) 
ri 
于 是 
四 (> NI 271)) 
+1 一 
-去 | am tino + (p+1—v'!) 
2 


区 1 


a 1 
te 了 (CD) 27 ty- 7 了 0D) 一 让 
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fj ?1 十 1 1 
Tithhvt+ a 《万 十 1 一 了 ) 


一 (一 Io 一 入 (十 Lo 一 1 和) 一 户 





ln 7 了 二 mm- tl lo) 
p 


十 如 op 
当 ni 相当 大 时 ,njAnl+1) 可 以 看 成 是 1, 上 式 就 简化 为 


下 (yy NA 2 = -1= (y-— 了 co) Dy 了 0D)， 
它 实 际 上 就 是 y 对 N(p1, 1) 的 马上 吗 拉 诺 比 斯 距离 ,这 一 结论 与 
用 轴 叶 斯 方法 , 费 加 方法 导出 的 是 一 致 的 . 当 我 们 已 知 yi, 2; 时 ， 


可 以 认为 n1,n2 都 是 co ， 因此 元 用 1 代 是 完全 正确 的 ,这 样 对 


上 述 结 论 就 会 有 更 清晰 的 解释 , 它 确 实 反 映 了 观察 点 y 与 总 体 
Na 1) 的 臣 离 ,对 于 NGCna 2) 自然 也 是 得 到 相似 的 结论 ， 
这 就 不 用 重复 了 

上 面 我 们 处 理 的 是 两 总 体 的 判别 ,对 于 多 总 体 的 判别 ,自然 可 
以 直接 推广 ,只 须 计 算 观 察 点 y 与 各 总 体 的 距离 就 可 以 判断 它 该 
归 人 哪 一 类 ,所 以 判别 分 析 的 问题 也 就 得 到 了 解决 ， 





习 题 三 


1. 利用 表 1.1 的 数据 ,去 算 一 下 有 关 的 估计 (可 以 仿照 例 中 的 方法 ,将 
有 些 合并 处 理 )， 

2. 证 明 公 式 (3.4): = 下 yy 一 Fe. 

(下 “的 定义 :车 对 给 定 的 一 个 矩阵 下 ,存在 基 满 足 ; 

FXF = F,XFX = X,(FX)Y = FX,(XF) = XF 
则 算 区 是 F* .可 以 证 明 下 存在 而 且 叭 一 , 且 有 
Ft= F(FF OI)t= (FF) FPF). 
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3. 计算 医院 资料 ( 表 1. 册 相应 的 均值 .方差 协 方差 矩阵 ,要 比较 两 个 医 
院 的 疗效 ,应 如 何 进行 ? 如 果 直 接 计算 成 分 = 来 比较 ,利用 ,来 比较 ,对 天 
考虑 到 三 年 共有 36 个 月 ,认为 可 以 用 大 样本 近似 , 当 作 正 态 来 处 理 ; 而 对 y 
用 加 法 撑 辑 正 态 来 处 更 , 这 两 种 比较 结果 在 结论 中 有 有 无 差别 ? 

4. 用 医院 的 资料 ( 表 工 .1) ,考虑 两 总 体 的 判别 问题 . 

5. 对 试验 设计 . 如 果 考 虚 HH = af,a 是 一 个 指定 的 常数 ,这 时 导出 的 
设计 阵 是 “ 正 交 "设计 .就 成 分 向 量 只 有 三 个 分 其, 用 (5.1) 模 型 , 求 出 的 设计 
是 什么 ? 用 模型 45.5) 求 出 设计 阵 是 什么 ? 两 者 有 什么 区 别 ? 

6. 对 于 混 料 试验 设计 , 漂 加 若干 个 试验 的 设计 可 以 仿 伟 5 的 讨论 进行 ， 
求 出 相应 的 A 最 优 的 设计 应 满足 的 方程 . 


参考 文 南 
1] 张 范 麻 , 方 开 泰 (1982,1998), 多 元 统计 分 析 引 论 ,科学 出 版 社 . 
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《中 译本 : 岗 蒂 等 译 , 成 分 数据 的 统计 和 分析 {1989) ,中 国 地 质 克 学 出 版 社 } 
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第 四 章 。” 狄 色 分布 的 统计 分 析 
$1. 准备 知识 


犹 氏 分 布 的 密 撤 函 数 并 不 复杂 ,但 是 它 的 统计 和 分 析 和 逻辑 正 态 
不 同 . 逻辑 正 态 是 将 成 分 向 量 x 作 适 当 的 变换 后 , 变 成 正 态 分 布 ， 
因此 处 理 迹 换 后 的 变量 就 和 正 态 相同 .而 狭 氏 分 布 没 有 这 一 方便 ， 
就 是 参数 估计 , 极 大 似 然 估计 也 给 不 出 明 禄 的 表达 式 ,只 能 用 数值 
的 方法 求解 ,因此 无 论 是 估计 和 检验 都 有 它 的 困难 . 
近年 来 ,广义 矩 居 计 法 的 影响 趟 来 越 明 显 ,对 于 犹 氏 分 布 的 参 
数 用 广义 矩 估 计 来 获得 有 关 参 数 的 估计 是 完全 可 行 的 ,因此 在 这 
一 节 我 们 扼要 地 介绍 广义 矩 估计 法 的 方法 ,所 得 估计 的 性 质 ,以 及 
有 关 的 一 些 结论 . 
通常 的 年 估计 法 的 基础 是 两 点 ; 
(a) 总体 的 算是 总 体 参 数 的 函数 ,如 用 表示 总 体 分 布 相应 的 
特征 值 ,总 体 参 数 是 期 望 值 x 和 总 体 方差 叶 , 于 是 就 有 
Fé= a, 
过。 = +p (1.1) 
因此 # 的 各 阶 矩 都 与 总 体 参 数 有 联系 ,它们 可 以 用 参数 的 钞 数 表 
示 出 来 . 
(b) 用 样本 的 给 来 代替 总 体 的 矩 ,从 关系 式 中 解 出 参数 ,就 获 
得 参数 的 估计 量 . 在 (1.1) 中 分 别 用 样本 xz,…, zt, 的 均值 二 与 


二 阶 算 工 > zx2 代 Ee 和 Ee?, 就 可 解 出 p 与 oz 的 估计 
姑 T nt 


从 (ab 不 难看 出 ,为 什么 只 限于 总 体 的 矩 呢 ? 为 什么 不 可 
+ 32 和。 


以 更 广泛 地 考虑 各 种 与 参数 有 关 的 上 的 函 散 呢 ? 如 果 我 们 用 9 
表示 要 估计 的 参数 , 可 以 是 向 量 . 上 述 (ay (b) 两 条 可 以 换 成 
a) 寻找 合适 的 函数 及,(#,0), 使 得 
Eh(E0) = 0， i=1,2,.,m 
(1.1) 中 ,天 (ED = Ep h(té0) = -op 
fb 用 样本 xz。 代替 及,(&;8) 中 的 &, 用 对 样本 代 人 后 的 
天 (rig) 求 平均 , 代 蔡 取 期 望 值 , 即 从 
TDs0) = 0 = 1,2, "oyTts 【1 . 2) 
解 出 8 ,从 而 获得 8 的 佑 计量 .如 果 半 中 有 天 个 参数 , 当 天 = 下 时 
可 以 求解 , 当 m > 时 ,就 要 考 虚 如何 去 求 合理 的 估计 量 6. 
如 果 令 
| ;9) = pp (za30), 
g(x;10) = (ges0) ,g(xs0) .ga (230)), 
那么 g(x ;98) 就 是 一 个 向 量 ,要 从 g(x ;98) 越 接近 于 0 越 好 来 考 
虚 , 就 是 选 估 计 6 使 g(x;9) 的 向 景 长 度 | g(x;8) | 越 小 越 好 ,也 
即 估计 量 8 使 | g(x ;9) 达到 最 小 ,用 式 子 表示 , 即 满 足 
Netzx;6)) = min | glr;8) 1 . 


然而 ,向 量 的 长 度 可 以 有 种 种 定义 的 方法 ,怎样 定义 使 解 出 的 6 其 
有 好 的 性 质 , 这 些 都 是 从 理论 .方法 上 应 该 讨论 的 ， 
目前 对 于 这 一 方法 的 理论 性 的 探讨 有 一 些 结果 ,上 自 的 是 选 一 


个 合适 的 度量 ,使 得 采用 选 代 方法 后 ,在 比较 宽松 的 条 件 下 ,5 可 
以 收 化 于 8 的 真 值 .有 关 这 些 可 以 参看 本 章 的 参考 文献 [1]. 


(1.3) 


$2. 估 计 


对 于 狭 氏 分 布 ,同样 有 估计 和 检验 的 问题 .我 们 沿用 上 一 章 的 


-129: 





记号 ,主要 区 别 在 于 不 加 声明 时 ,总 假定 本 章 的 样本 来 自 狄 氏 分 
布 . 

zz 都 是 加 +1 维 的 向量 ,它们 组 成 的 样本 矩阵 
工人 


下 一 
nxtpt+1) 


二 《zu)， 








Zn) 

a = 1,2, not = 0,1,,p. 
相应 的 样本 均值 向 量 二 和 方差 协 差 答 阵 S 是 
去 = Lx 1,S = Le 
1 

天 一 工 


假定 总 体 的 分 布 密度 是 
Xx! 
r(26,) IH (ai) 


ai > 0,x; 0 二 O01 ps Dz = 1. 
i=0 
从 第 一 章 就 知道 成 分 向 量 z= (x0,zx1,… ,zp) 的 一 二 阶 算是 





x (LL iL)X. 
nH 


oi 
Ex; 二 站， 
Var(zi) = alA -a)/[A:CA + 1)), (2.1) 


i = 0,1,.",p, 
Cov( zis Ej) 一 一 an/{A(A 十 1) 1 天 了 
其 中 A = yo .因此 一 共 只 有 请 + 个 参数 , 怎 伴 估计 这 户 + 1 
= 自 


个 参数 呢 ? 

G) 用 一 般 的 矩 司 计 法 

用 样本 均值 估计 总 体 均值 ,样本 协 差 阵 估计 总 体 的 协 差 阵 , 这 
时 就 有 











2 -ly = 
( 竺 )= 证 1 一 加 二 了 0,1, ps, 

个 、 
(Hs = 1 D(x — zi) Crs — Ei), 
A{A+1) ”1 

人 

一 a _ _ _ _ 

i ji,j =0,1,.…….p. (2.2) 


(2.2) 给 出 的 关系 式 有 (p+1)( 记 +) 从 个 ,大 大 地 多 于 要 和 居 计 的 
态 +1 个. 可见 这 时 简单 地 用 一 般 的 矩 估 计 法 就 会 遇 到 困难 , 它 必 
然 要 引 疝 广义 矩 估计 法 . 
《ii 用 最 大 他 然 估计 法 
样本 相应 的 联合 密度 是 
L(A) |" 
ey 1 6™ 


i20 
用 工 表示 似 然 函数 , 则 
{=inL = nlnT'(A}— nlnT (Ca;) 
20 


十 D(a, 一 D) (DInzs). 
i=0 a=1 
对 ai 求 偏 导数 ， 人 0, 就 得 方程 





Bi _ nr(A) _ nT l(a) 
0 3 = FAY - rla) + Dns, 
i =0,1,.…,p， (2.3) 


其 中 矿 (w) 是 (a) 对 a 的 导数 .方程 (2.3) 是 很 难 直 接 求解 的 ， 
只 能 用 数值 的 解法 . 


如 果 利用 于 人 2 的 展开 式 


中 一 上 


”131， 








1 .1_._1ly 
a A= # 27 Ina, i = 0,1,",p, 
也 即 
_ 1 
i 一 1 1 1- Alne,”’ = 0,1, sp 
A Ng; 
其 中 


bj 


1 
Bi 一 (1 x )",i = 0,1,.…,p. 
对 上 式 两 端 求 和 ,得 


2A=AS'— 1 
因此 得 估计 


a _E_ 1 
iN 1 = > [二 二 的 根 


《2.4) 
位 ; 二 A/(1 一 Alng:) ,i 一 0,1,.….,p. 


(2.4) 式 中 把 满 足 的 方程 有 不 少 根 , 它 是 一 个 p+1 阶 的 多 项 式 ， 
”因而 有 p+1 个 根 ,这 样 还 是 不 能 得 到 一 个 显 式 的 估计 . 
值得 注意 的 是 ,a; 的 估计 从 (2.4) 式 可 以 看 出 ,它们 都 是 样本 
za 的 几何 平均 值 (本 =。 )* 的 函数 . 
r=1 
《ii 用 广 文 逢 估计 法 
广义 矩 售 计 法 ,要 求 寻找 一 些 丽 数 及 (x39) 使 Eh (x;0)=0 
对 一 切 9 都 成 立 .最 自然 的 方法 是 从 成 分 向 量 z 的 联合 密度 出 
发 , 设 工 的 联合 密度 为 /(x;0), 于 是 有 
[f(zs0)dz = 1,Y9 成立 ， 
两 边 对 6 求 微 商 , 于 是 有 


0 = | 355dz -站 ( 动 ) =。 Frid)dxr 
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可 见 取 太 = “9 是 合适 的 , 它 得 到 的 就 是 似 然 方程 (2.3) 有 端 


所 相应 的 函数 ,因为 /= In, 3 一“ 4. 从 这 里 更 可 以 看 出 广 
义 矩 估计 与 最 大 似 然 估 计 的 关系 .最 大 似 然 估计 就 是 选择 了 一 组 
特殊 的 ,并 且 hh 的 个 数 与 参数 的 数目 正好 相当 .下面 对 犹 氏 分 
有 ,我 们 来 验证 一 下 这 个 看 法 . 

成 分 向 量 x = (x0,x1,…,xp)》 的 联合 密度 在 ,上 的 积分 是 
1, 即 


p 
wl Jdzxidxy 三 1， 


也 即 


[a = 汪 n- 


DD 


两 边 对 a; 求 偏 微 商 ,得 :对 ?=0,1,…, 户 有 
J nz) (I #7 ) dedz, 
和 i=0 








四 
[I res) 
一 = rn (ai ) » 
也 即 
AT a 呈 _ Tla) Fr(A 
让 rc ma) (Is qridzp = FS FS. 


上 式 左 端 就 是 EInx;, 因 此 上 式 就 是 





TA) (Ca; 本 
Elmz + FA Fe ) 0 0 


因此 取 h(x;0) -Inz+ 下 (全 - 下 一 1 ,pp 后 


ToCzrs;0) 
# [3 


1 > 。 _ 工 + LAD) rr (ai) 
= (rs0) = 1 (met FUA) ~ Fla) 让 


中 “ nl {ae 
=1 [Sz + 下) - ml. 
很 明显 ,上 式 右 端 就 是 似 然 方程 (2.3) 相 应 的 函数 . 
(iv) 采 用 线性 模型 来 估计 
我 们 还 是 从 (zr0,z1,…, xp) =xx 这 个 咸 分 向 量 的 n 个 样本 
zt),…, (ny) 形成 的 算 阵 X 开始 ,此 时 














工人 
a (za) = ， | (ro a 2 
(nn) 
相应 的 样本 均值 二 与 协 方差 矩阵 S 是 
天 一 Lx 1,S = 一 
六 n—1 


其 中 
L, = XL, -十 11)X. 


为 了 估计 时 表达 式 更 简明 ， 将 狭 氏 分 布 的 参数 CO CT， 
作 一 变换 , 令 


点 = Sa,, bi 一 ai/ = 0,1,.…,p 
i=0 
于 是 可 将 (2.1) 式 改写 为 
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五 ri = bi, 
- 
点 +1I 


1 ， i 
Covktzi Zi) = A ti 天 一 人 1 


Varfzi) = Bb.(1— 8.), 


(2.5) 

此 时 共有 p+1 个 参数 ,因为 5 = 1. 用 向 量 和 抵 阵 来 表示 ,就 
上 一 中 » 
可 以 导出 如 下 的 形式 


记 
bo 0 bo 
DD)=) .1s=1), 
0 by bp 
于 是 有 
Ex = b,Var(z) = Fi(D(B) -Ww). (2.6) 


很 明显 ,参数 5 与 期 望 值 有 有关, 参数 A 与 z 的 协 方 差 拭 阵 有 关 ， 
var(z) 是 退化 的 ,因为 

(D(b) -bb Yl1=6~b=0. 
尽管 D(8) 一 妈 是 退化 的 ,但 它 的 “+ ” 道 是 唯一 确定 的 .不 难 证 
明 ( 留 作 习题 去 求 出 这 个 表达 式 ) 


(D(p) ~ B06)* =D05-0 - Ey 11 


-LT (2.7) 





其 中 
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站 eh 


记 4=D(5) 一 友 ', 要 证 明 {2.7) 式 是 A1 ,只 须 证 明 44 ,4 和 
是 对 称 的 ,AA1A=A,A*AA' =A1 ,实际 上 可 以 算得 





十 一 
AA+= 了 pth 
ya 1 
A'A=1- srill, 


因此 自然 就 有 
AA+A=A,A'AA'= A+， 
难点 是 在 于 如 何 找到 这 一 表达 式 . (提示 见习 题 ) 
有 了 这 些 准 备 ,就 可 以 用 两 种 不 同 的 方式 将 它 转化 为 线性 模 
型 的 问题 ， 


一 种 是 考察 每 一 个 成 分 向 量 的 样本 x;,i =0,1,……, 户 , 易 见 有 


了 三 (Tl1is Tni)s 


Er = 1b, 
nxl 
1 (2.8) 


Var( xX;) = 1ol 一 下 JJ 
对 i 一 0,1,…, 思 都 成 立 .利用 均值 x; 1= z; 估计 &:, 利 用 方差 


st = -二 ix -1 Lx 
去 估计 5,(1 一 868.)ACA +1), 于 是 就 有 





bi 一 Ts 
i _ 0 Ei) 1 (2.9) 


对 =0,1,…, 户 都 成 立 . 这 样 我 们 就 有 为 +1 个 上 的 估计 量 信 ， 
为 了 区 别 我们 用 让, 表示 用 第 i 个 成 分 向 量 样 本 x, 导出 的 A 的 估 
计 , 这 就 是 (2.9) 式 中 的 A,， 


由 (2.9) 式 给 出 的 后 能 香 保证 是 一 个 正 数 呢 ? 下 面 的 引 理 就 
回答 了 这 个 问题 . 


16 ， 


ne 





引 理 2.1 设 0<au<1l,i=1,2,…,n; 则 
Su Fnr(l- a). 


i=1 


证 明 Do z= De 一 nw?2, 由 于 0< ao 二 1 一 


t= 三 


1,2,: .nn ,因此 u3<t. 于 是 有 

> (ui - 7 Du nr? = nw (1 一 站). 
从 引 理 2,1 可 以 看 出 (2.9) 式 中 的 A;>0 通常 是 不 会 有 问题 的 .但 
这 些 A; 是 不 独立 的 ,如 何 从 这 些 Ai 去 综合 一 个 更 好 的 站 ,这 是 应 
讨论 的 ,如 果 我 们 采用 另 一 个 方式 ,就 可 以 直接 得 到 一 个 入 ,这 就 
是 下 面 的 第 二 种 方式 . 


我 们 直接 从 成 分 向 量 的 样本 惩 阵 X 开始 , 今 有 
(2.10) 


ay 一 1 ban’ 

X 的 各 行 独立 、 同 协 差 阵 记 TCD(8) 一 把 

要 注意 此 时 8 工 =1L 是 一 个 约束 条 件 ,因此 (2.10) 这 个 多 元 钱 
狂 错 型 是 带 约 东 条 件 的 线性 模型 ,而且 协 方差 矩阵 是 退化 的 ， 

现在 将 约束 条 件 的 解 全 部 表示 出 来 ,把 模型 (2.10) 化 为 无 约 
束 的 模型 ,然后 直接 用 多 元 线性 模型 的 结果 来 求解 . 当然 入 可 以 去 
掉 关中 的 一 列 , 变 成 无 约束 的 情形 .这 两 种 方法 所 得 的 结果 是 一 
样 的 ,前 一 种 可 以 参见 文献 [2], 我 们 这 里 采用 第 二 种 ,去 掉 xo 对 
应 的 样本 ,就 得 到 

买 。 一 《XI1X2 Xp), 
于 是 令 6。 =(B1,52,…,6bs) 后 ,就 有 
EX,. = 1b,, (2.11) 


9 


XX, 的 各 行 独立 , 同 协 方差 阵 了 和 CD(6.) 一 5:5 ). 
此 时 ,直接 用 多 元 线性 模型 的 结果 ,就 得 到 
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5. = 工 X 1, (2.12) 


nm 
(np) = 0X, lo -去 1， (2.13) 
其 中 - 
3 = Db.) 一 58) 
利用 (2.12) 和 2.13) 就 可 以 求 出 4 的 和 计量 及 .由 于 于 中 只 有 一 
个 参数 A 需要 个 计 ,而 六。 用 半 . 村 计 是 无 偏 的 最 小 二 乘 佑 计 , 具 


有 优良 性 .从 (2.13) 式 可 以 学 出 入 的 几 个 不 同 的 帖 计 
利用 tr> ,由 于 


try) = (D5.) bu.b',) 








于 是 有 
_ B.C1 ~ 6:) 
4 = 后 一 一 一 1. (2.14) 
tr 
利用 1 2 有 ,由 于 
- 1 - 本 A 
1 2 1 = DG)1 一 TO 了) 
= 亏 上 ATIl- 0- (1- 60)) 
A + ie°1 一 bo) 
因此 有 
和 eatl - bo) 1. (2.,15) 
L121 





利用 书 的 行列 式 ,由 于 
[|= (zs) De) -6 
1 





产 





(1 -bs Di ) 5 De) 1 








(xz) 
= (#1) 01- pb’, 1)1 D5,) | 
一 (a + 1) fe 
因此 有 
ft 
全 =- [5 -1. (2.16) 








很 明显 (2.14) ,{2.15),(2.16) 给 出 的 及 是 不 同 的 ,不 难看 
出 ,利用 并 的 函数 ,还 可 以 给 出 不 同 的 估计 .为 了 区 别 这 三 个 居 计 ， 


我 们 用 外 (1)、 访 (2)、 有 A 及 (3) 依 次 表示 (2,14)、(2.15)、(2.16) 的 司 


计量 .注意 (2.9) 式 的 估计 量 为 A,,i=0,1,…, 思 . 

为 了 比较 这 些 A 的 估计 县 的 好 坏 ,比较 它们 各 自 新 近 分 布 的 
方差 ,是 一 种 常用 的 方法 ,这 些 估 计量 都 不 是 苑 偏 的 ,但 是 它们 的 
偏差 在 大 样本 时 可 以 忽略 ,所 以 只 比较 渐 近 方差 的 大 小 ,此 时 要 用 
参考 文献 [3] 中 的 一 条 定理 ,我 们 不 加 证 明 来 引用 ,作为 本 节 的 引 


理 2.2. 


引 理 2.2 设 1 ,x2,… ,zs,"“* 是 独立 而 分 布 的 随机 向 量 序 
列 ,x; 均 为 px1 的 向 量 , 有 : 
Exr; = 0,Var(x;) = 0. 
驻 f+) 是 px1 向 量 1 的 函数 ,具有 一 ,二 .三 阶 各 种 偏 微 商 , 且 均 
为 2 的 连续 函数 , 取 
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则 当 828 天 0 时 ， 
vn(f(z) - A(0)) 
的 极限 分 布 是 N(0, 808). 
引 理 2,2 告诉 我 们 ,样本 均值 三 。 的 函数 A 二 ,) 的 渐 近 分 布 


是 N(A(9)， 840 】 ,斯 近 方差 就 是 B08 人 .于 是 只 项 比较 B98 
的 值 , 就 可 以 判断 谁 好 谁 差 . 关键 是 将 相应 于 引 理 2.2 中 的 xi， 
玉 `) ,8, 人 2 都 找到 .我 们 先 讨 论 A,, 然 后 讨论 A(i),i=1,2,3. 


注意 到 A; 相应 的 了 都 是 相同 的 ,只 是 各 自用 成 分 第 i 个 分 量 
的 均 慎 与 方差 来 作为 自 变量 ,所 以 具 须 讨论 其 中 的 一 个 ,其 余 均 可 


类 似 地 求 得 . 由 于 各 本 身 就 是 样本 的 均值 ,而 
St = (Dz% ~ nd)/(n -1) 





证 一 了 六 
考虑 i 固定 ， 
Ta 站 
»= |e | ,1 ,7， 
交加 Yo? 
_ y1(1l ~ y1) 
fly1 YT2) YL 2 
yy2™7 yl1 
其 中 
- _lv lw z 
V1 ne bi, 
加 1 1 2 
J2 a 和 
nn oa #7 
于 是 


Ss? = (2 一 1). 
当 很 大 时 ,可 以 认为 Sf= 3 一 了 和 于 是 就 可 以 用 引 理 2.2 求 


出 Ai 的 渐 近 分 布 . 今 
:10 - 


EE - 











已 
9= els- |. 
=E|l =|, , 
Ti 1 tt Ab:) 


-| Var( xi) Cd 
Cov(zr?i,r) Varlri) 
bl 一 b:) 
有 1 
2bi(1 — BCL + Ab;) 
(A+D(A+2) . 
26b:(1 — bi)(l + Ab,) 
(A+D(AT+2) 
(A+ lA +2)A +3) 





念 
:1 


一 
ti2— tf 





fltist2) = 


因此 
BF ff -2tt2+ to 
af1 (£2 — 1 


af ti(l — #1) 


at (1 2 

在 上 两 式 中 ,用 如 代 刘 , 各 人 二 人 4 和。 代 za, 就 可 以 求 出 月 的 值 , 妈 
| - A+1 |1+T245， 

加 一 








因此 
【和 十 1 和 2 To(l ~ Hi) + 2A6,) 
pp = Br sal A+1l 
2b:(1 一 bl 十 AD,) 
(A +1)(A + 2) 





-a (A T+} + 2Ab.,) 
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+ JA[GCA +1) + (4A? ~ 0)b; — (4A + 6) .451 | | 
{A +2)(A + 3) 


(A+1) 
Bb(1 ~- 65. 


+(444+2A43 一 144? — A +6)6; 
— A(4A3 + 10A7 — 16A - 6)65?2 + AT(2A — 3)53]. 
完全 同样 的 方法 ,可 以 求 出 (1)、A(2)、 六 (3) 的 浙 近 方差 ， 
入 (1) .有 (2) 的 表达 式 相似 , A(3) 很 不 相同 ,我 们 详细 推导 
A(1) 靳 近 方 差 表 达 式 ,将 A(2) 和 后 (3) 留 作 练习 . 


1(6A3 + 9A2— 5A -6) 





注意 到 
S181 — 6) 
AD = 1 
tr2, 
Bd bi) 
-il ~- 1, 


因此 相应 的 了 是 2p 个 变量 的 函数 ， 即 可 取 


> ti(l1 — ii) 


有 :rp) 一 
Ey 


于 是 
df £3 一 Af 十 ri 


> 本 1,2,…,p, 
[So 一 二 
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SL = 1,2 p 
or; 时 EJ + 
en 一 节 )] 
8 Bi 
因此 可 以 求 出 8 | | B = | :| ,i = 1;2, 其 中 遍 
Bez 
Bis 
9 
By = 于 pu = 让 j=1,2,…,p 
注意 到 
ip, = 1 5 - 1 - bo, 
+i 三 机 i=1 
于 是 | 


Bi 
Ew -~ | ? 
上 


A+l 





_ Bill — bl+ 2A5 CA+1) 








(Dal a) ,j= 1,2,° 
Db a) 
和 a- s/n 
At Lip 





一 ?用 
al 一 已 ) 
此 时 ,相应 的 人 2 答 降 是 2pX2p, 可 以 分 四 块 写 出 ,县 


n= [2 |， 
ta 全 22 


我 们 引信 人 五 表示 向 量 (ipz，……pp) ,于 是 


fi = DB) — bb YA/AA + 1), 
fa = (Cov (zi, x})) = fa. 
这 在 求 及, 时 已 给 出 Cov(x;,zx2) ,而 
22 = (Cov( rf ,7r})). 
雪 此 还 需 给 出 Cov(x; ,x3) 与 Cov(z ,zx?). 从 狭 针 分 布 的 性 质 , 立 
即 可 得 : 当 i 关 ; 时 
Cov(zi ,7?) = Frir? 一 EriEr? 
amnitas + 1) 人 | ait ai 二 1) 
A(A+1)(A+2) -A A(A+1) 
2aai(a; + 1) 
A2(A + CA + 2) 
_ 2p + Ap,) 
CA+DCA+2)’ 
Cov(x1,77) = Erir? — ErfEz? 
25b (1 + Abi)(l + Ab) (2A + 3) 
(A+1YA +2)(A +3) 








而 
Var(xt) = Er! ~ (ExiY 
dl + 1) (a +2)(Ca; + 3) _ (2 十 8) 
A(A+TIATIA+D) VACA+1) 
_ Bi(l+ bi) [6ACA +1+6 + Ap) + 4A° bl = Ab)] 
(A+IPF(A +T2)A +3) 











这 样 就 求 出 


， BQ 1212| | Boa) 
-( )| | 
pnp Bn By fa {22 Bo) 
= uP + 2 DB0) + Bey fda Boo) 


记 
一 Cil 十 2c12 + ce22. 


只 
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(A+ 1 bitl— BO) + 2A51) 


(S601 5) 


i=l 





Ci 一 








bl1 ~ bo) (1 + 2A6,) 
bl- PI) + 2A8,) 





om- wy : 
Bo(1 ~ bp) (1 + 2Ab,) 


-A+D YU 6 +2) 
(Dua 6)) 


x (Bbi = bb) — bl — b)(l+2Ab) 


(A+1) [63d -bY(l+ 2Ab) 
(Dhl 6)) 加 








+ (Daa - bi) (1 + 2Ab))] 
Cl12 -poppo 
《4 二 了 )? 
(> bl 6)) 


* [- (ee ) 站 


51 ~ bi)l + 2Ab) 














bol1 6,) (1 + 2A8,) 





六 +1 
(A +2)( Dot - 6)) 
i=1 





[2( 55301 ~ 6)01 + 2A5,)) 


x (Dhl + ab))] 


2(A + (Poa — Bi)(1 + 226,))( pA + Ap;)) 
二 上 二 上 j=1 





(A+D( HB 6)) 
it 
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同样 地 可 以 算出 
C2z = Ps DB) 
= fn 1 
(Po Qa-s)y 


= (A+1) | + 1)(2a; + 3) 
(Pao)) A FIA TDA 


2(2A + 3) Cina + "| 
(A+tIP(A +2)(A +3) 





2(A + Dad + ABb:)3 + 2A8) - 20 + 3)( Sad + 好) 
一 1=1 1 二 让 





(A +2A+ I Dh 8)) 


$3. 回 归 


现在 考虑 狄 氏 分 布 一 部 分 变量 对 另 一 部 分 的 条 件 期 望 与 条 件 
协 方差 矩阵 ,从 而 导出 成 分 向 量 的 分 量 与 分 量 的 回归 形式 . 


> TU) v 
设 z=| |= (e021 my) 是 一 成 分 向 量 , ra) = (zo， 


T2) 
Tl TE ,TA2) = {rp+1 ET2 "Tp) 今 TO Tl "sip 的 联 


合 密度 是 
Eo 


下 rc 


rr0 二 1- 妆 > Ox > 0 = 1,2,.",p 
r=l 


而 T(t 一 (zos TL Tk) 的 联合 密度 是 





[3 
Ori =0,1,.,k, Dx <1, 
i 二 全 
因此 zc 对 xD 的 条 件 密度 是 
Plro)| zx) 


rl( >， ai) IT 2 


i=k+1 FE=+1 


让 mea 


i=k+1 i=0 
Xi>07= k+l,*,p, Da<1- Da (3.1) 
因此 可 以 求 得 条 件 期 望 与 条 件 方差 ， 利用 公式 
[zlA — Ti)*lidrx = Aete -itB(a 





pn a-l1 


rs ji 


gb 


就 可 求 得 
A 
Elx|zw) = (1- 2 x;), 
Hi i1™0 
j=E+1 
i= 上 k+l1,.,p, 《3.2) 


_ 一 要 让 要 《和 — Qi) _ 2 
Vari zi | zon } at Car rl 和 三 ， (3.3) 


其 中 


dk} 三 >) jst 三 并 + 1,*",p， 
此 十 


j= 
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上 
Covlzizw [x | =- (人 (E 一 , 
vy| x Zz) | (| Aa ri 2 


i = k++1i,,p. (3.4) 
上 面 求 得 的 条 件 期 望 ,对 于 考虑 回归 卫 数 的 形式 是 有 帮助 的 . 
(3.2) 式 右 端 是 两 项 的 腾 积 ,每 一 项 的 统计 意义 十 分 明显 .条 件 其 
望 是 zt 各 分 量 的 线性 函数 ,而 且 系 数 都 是 相同 的 ， 
(3.2) 式 的 一 个 特殊 情形 是 = p -1, 此 时 ,(3.2) 式 就 成 为 


下 
Elzpl zo zi zp = 1 名 本 


由 于 > = 1, 因 此 上 式 自然 是 成 立 的 .然而 ,(3.2) 式 给 我 们 提 


供 了 另 一 种 估计 参数 ao,a1,…,ap 的 方法 ,就 是 利用 成 分 向 量 的 
一 部 分 对 另 一 部 分 的 回归 ,可 以 给 出 参数 的 估计 ,而 方法 与 前 面 讨 
论 这 的 是 类 似 的 .为 了 便于 对 比 ,将 (3.2)、(3.3).{3.4) 用 另 一 个 
方式 表示 ,就 可 以 很 方 恒 看 出 相似 性 . 令 | 


是 
di 二 zf (1 DD) i= +l,p, 
. j=0 
SER+1 
yD =|; |， 
yp 


k+l 
1 。 
Elyw|zrw}= a : 二 Pbrpys 


Up 


于 是 有 


(3.5) 
Varl yc | zcbj = ze ri Pb) -bpb tl]. 
将 (3.5) 中 的 条 件 期 户 看 成 是 期 望 ， 5) 式 与 狼 氏 分 布 的 
Er = 6b,Var(r) = A+ A [DD(8) -| 


是 完全 相似 的 ,15teo =1, 这 与 下 b=1 相似 ,参数 ati) 与 A 完全 相 
» dg + 


似 . 所 以 前 面 讨 论 的 用 来 估计 上 45 的 方法 ,估计 的 方法 , 均 可 用 来 
估计 5cjy 和 ax) ,这 里 就 不 再 一 一 重复 了 . 

更 值得 注意 的 是 ,条 件 期 望 的 这 一 特性 ,在 一 定 意义 上 是 狭 氏 
分 布 所 独 有 的 . 在 参考 文献 [4j 中 ,有 下 述 定理 : 

定理 3.1 设 ro,zri,…，zn 是 成 分 随机 调 量 , 即 x; > 0,i = 
DO,1.… Pp, Vx, 一 1, 有 连续 的 窗 讼 函数 pplz Xp); 菁 p(rl, 

i=0 

,Xp) 满足 : 

《iD 在 单 形 D, 上 ,p(xi,… ,wp)>>0; | 

(ii) p(xis' ss) = 下 (Sa) fl ;县 ai 均 太 于 0;: 

(Gi) 对 和 任 一 正 整 数 久 ,i 一 1,2,-…,pp 使 | 

Elz| Zi = C(1— 5) ， 

其 中 C 是 一 个 常数 ， 则 Cov Tp) 定 是 狭 氏 分 布 ， 

这 一 定理 还 可 以 进一步 推广 ,将 (让 改 为 

p(x sy) = nS)ITfs) 

其 中 至 少 有 一 个 f 是 项 函数 . oy 
是 5 的 线性 函数 ， 定理 的 结论 仍然 威 立 ， 所 以 条 件 期 望 的 这 一 
符 住 ， 对 于 狄 氏 分 布 是 具有 特殊 重要 的 意义 


$4. 判别 分 析 


现在 来 求 犹 氏 分 布 的 判别 函数 . 设 有 两 个 犹 氏 分 布 D (as， 
G10p) 与 DL60,61,…,5y) ,分别 记 为 D(a) 与 D(5), 如 果 来 
自 D(a) 的 概率 为 x ,来 自 D(5b) 的 概率 为 x ,x + x =1. 于 是 观 
察 到 样本 z= (xo,r1,… ,xp) 后 ,相应 的 后 验 概率 为 
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raD{laoals",ap) | 
meD(aeo ap) + roD( Bos , bp) 
ba borbls'", bp 
(Db) | x) 一 CT 1 
当 有 (DD (a) 1x) 守 h(D(5)|z) 时 ,就 将 z 判 为 来 自 D(a); 当 
h(tD(a)|z)Sh(D(B)|z) 时 ,将 z 判 为 来 自 DL5). 因 此 xz 来 自 
Dla)eh(Dla) | xz) 守 h(D(D) | zx) 
xaD (lao, ap) > xeD( bo,. ,bp) 
Dilagr'”, 
pe: " 2 > > x 
上 式 就 是 密度 之 化 大 于 一 个 纵 定 的 值 ， 而 两 个 密度 之 比 也 可 改写 
为 两 个 密度 各 自 取 对 数 之 后 的 差 , 这 就 导出 
iD(ao ap 一 InD (bo ,6b,) 


=InT (Sa)+t [tas -Dinz - nr(ai)] 
= i=0D 





i(D(la) 1 zx} = 





= nr (D6) PLB Din - Inr(6)] 


3 r(3a)IT rcs,) 
= (a; — bi)Inz + In i 2 ， 
= r(Do)IIree) 
可 网 判别 函数 是 Inz; 的 线性 函数 ,其 中 参数 a;,b; 可 以 从 训练 样 
本 产生 的 估计 量 得 到 . . 

现在 从 判别 信息 量 来 考虑 ， 如 何 导出 相应 的 判别 函数 ， 注意 到 

I(D(a), DCE)) 三 Et{lnD{ao,* ” ,0p) 一 jnD(5o，… ",b»)), 

其 中 上 表示 对 分 布 D(ao,a1,… ,ap) 求 期 望 值 ,因此 利用 上 面 的 
公式 得 到 





I(D(a),D(6)) = DD (0s ~ bi)E,lnzs 


"10 - 











eg 

r(Da)i™ Reo 

从 狼 氏 分 布 密度 导出 的 等 式 

z F(al) 
[人 值 wrrduaram= 芋 一 ， 
D, i=0 F(27az) 


两 边 对 a; 求 偏 微 商 ,就 得 到 
Elne; = 工人 ad -工人 4 























Tai) TiAD)!?’ 
{A = >a) 
代入 I(D(a),D(5)) 的 表达 式 ， 就 得 到 
1(D(a),D(5)) = 了 (a -区 | 2 - 人 | 
riA Ho 
+ mI Fe (4.1) 
其 中 B= 6 
类 似 地 ， 可 以 导出 
I(D(5), D(a)) = De 一 LT -到 名 | 
有 (有 i - 
RI ze. (4.2) 


现在 给 了 一 个 观察 到 的 成 分 向 量 = = (xo,…, xr,》, 当 我 们 使 用 洗 
别 信 息 量 时 ,如 何 去 导 出 相应 的 判 噜 函数 昵 ? 

由 于 判别 信息 量 I (D(a),D(5)) 是 以 D{a) 为 基准 , 淆 晤 
DD(55) 与 它 的 差距 .因此 如 果 D(a) 的 参数 是 由 训练 样本 给 出 的 千 
计 , 记 为 4=(as,21,…,Ap) .于 是 在 新 增 了 一 个 观察 向 量 z 之 


”了 5L “ 


后 ,就 得 另 一 个 估计 & .将 D(&,) 看 成 I(Dta),D(5)) 中 的 
D(5), 这 样 LDta),D(a,)) 就 给 出 了 观察 到 的 成 分 向 量 z 与 
Dftza) 的 差距 .同样 的 方法 ,可 以 庆 量 出 z 与 男 一 个 分 布 D(5) 的 
差距 , 哪 一 个 差距 小 ,就 应 归 入 哪 一 类 分 布 ,得 到 了 判别 的 公式 ， 
这 一 种 考虑 ,同样 地 也 可 以 用 于 对 称 的 .由 判别 信息 量 导 出 的 
J(D(a),D(t5)), 利 用 上 与 了 的 关系 ,就 得 到 


JCD(a),D(B)) = Da - | 二 Ca) (Bi) 








PCai) 一 Tp;) 
.TB) | 
+ 下 站 j 人 |. (4.3) 


此 时 ,用 训练 样本 算出 a 的 估计 4 ,用 训练 样本 添加 新 的 观察 数据 
z 等 出 a 的 估计 a。 ,用 aa 代 =,a, 代 三 就 可 以 求 出 z 与 D(z ) 的 关 
距 . 由 于 z 的 表达 式 不 同 , 有 的 还 无 法 求 出 表达 式 (如 最 大 似 然 个 
计 ) ,所 以 在 实际 中 应 用 (4.3) 式 也 只 能 给 出 一 种 算法 . 为 了 便于 说 
明 ,我 们 用 一 个 比较 特殊 的 例子 来 解释 它 的 用 法 ， 

假定 从 D(a ) 中 已 获得 的 训练 样本 是 、X,,, 它 的 均值 向 量 是 


云 = Lx1. 注意 到 (4.3) 可 以 改写 为 


Cpt+13x1 


J(D(la), D(B)) -A>( 生 - 名 | Fe 本 FA 


-TB)_T 29]. 
rT(B) rr(b:) 
这 样 上 式 右 端的 项 ,分 别 用 各 自 的 估计 量 代 人 ,注意 到 似 然 方程 给 
出 的 估计 ,就 可 以 用 和 中 的 元 素 ze 和 得 到 的 观察 值 z 来 估计 
J(D(a),D(5)), 从 而 得 到 z 与 DD(a) 的 距离 .因为 


工 Y Te 三 (4) 











1 总 ， 人 
EP 可 以 估计 入 忆 托 估计 ) 
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bn Ee in 





区 一 1 可 以 估计 A ,( 线 性 模型 的 估计 ) 
Ss? 
其 中 


工 ; 一 1 Dx? 一 
添加 了 一 个 r= G20. 





i Ti), 
之 后 ， 


TT(b) Ir(B 
nt Te + nx) 可 以 信 计 ep -下 各， 


n+ Fi (Dz 十 六 ) 可 以 全 计 只 ， 
> Fin (1 Tix) 


次 一 1 可 以 情 计 B， 
S13、 














其 中 


i 二 





-二 (Dz 十 i ) 
Sf, = 1 (Da z+ (x zi )). 
于 是 就 得 到 (D(a),D(5)) 的 千 计 值 是 


B 
和 zi- (F(z + 
<“ [ine (Pinze + nes) 
Dlnzoafs 
: 《人 二 — B(nz, i An + DD) 
ta 





闪 (Pinea/s), 


A= > zi(l ~ z0)/ > S53， 
B= $a /a 


这 样 就 求 出 了 z= (0, ,Tp) 对 训练 样本 X 所 形成 的 分 布 


(p+1) 
Dla ) 的 车 离 7 .同样 的 方法 和 相似 的 表达 式 ,就 可 以 给 出 x 对 另 
一 个 训练 样本 给 出 的 分 布 有 儿 大 率 离 ,比较 距离 大 小 ， 就 可 以 决定 
z 属于 名 一 个 分 布 ,达到 了 判 章 的 要 求 . 


其 中 


$S. 典型 相关 分 本 


狐 氏 分 布 的 方差 协 方差 窍 阵 有 特殊 的 结构 , 它 与 分 布 D(ao， 
…, as) 中 的 参数 有 密切 的 联系 ,因此 成 分 向 量 的 部 分 分 量 之 间 的 
典型 相关 的 分 析 方 法 有 一 些 特殊 性 . 

我 们 从 (zo,*…， 人 


VE = Viro,", xp) = 序 二 A+IDE) -bw ), 
将 并 分 为 两 部 分 z= (x zt2)) 后 ,V(x) 和 上 4&8 也 相应 分 块 ,得 
Vi Vie| +1 
Vs) = 的 Vz)p—&. 





注意 到 6 相应 分 为 (5%1 5 包 )) 后 ,就 有 
Vi = A (DGG) - bo 8), i = 1,2, 
一 工 。 ，。 . 
Vy = A+IeDSD; i ji = 1,2. 


而 由 于 5%41y1 关 1,i 二 1,2. 因 此 


Va = {A+1) DD) + Tt) 1 二 1,2, 


-114 * 


其 中 
bh = (b6' ,B68 ), 
| 8 动 = (brtir'rs bp 
通常 情况 于 , 求 典型 相关 系数 ,应 考虑 矩阵 
Vi Vo Va Va 
的 特征 根 , 它 有 多 少 个 非 零 特征 根 ,就 有 多 少 对 典型 相关 的 变量 . 
但 对 犹 氏 分 布 这 一 特殊 情况 ,注意 到 
Vi 三 一 A bb, 
它 的 秩 是 1, 因 此 Vn! Viz Va! Va 有 而 且 只 有 一 个 非 零 特征 向 
量 , 所 以 只 有 一 对 典型 相关 变量 . 由 于 成 分 向 量 分 段 为 x 与 X62) 
后 ,有 
l=1zr=1lr+lro), 
明显 地 表明 了 ,1ztU 与 1 之 人 是 一 对 典型 相关 变量 .由 于 
Varll’zey) = 人 (DB ~ Bwbiw) IAA + 1) 
=1boy(l ~ L800) /AA + 1), 
Var(T 0 ) =1B wl -100 )AA+ DD), 
Cev(Eztn lz)=- (L660) (Lb) AA +1). 


因此 取 
Ar1 
§ = To bt T lar 
_ /A+l 
7 = Tob Tle 


之 后 由 于 1=15= bey + 也 ;就 有 
Varlt xz(0) = 1,Var( yr)) = 1, 
Cov( Ero yr02)) =— 1-. 
因此 x0 与 yw02) 是 一 对 典型 变量 ,其 余 与 & 正 交 的 向 量 必 为 系 
数 的 zx 的 线性 函数 ,与 3 正 交 的 向 量 作为 系数 的 zw 的 线性 函 
数 ,彼此 都 是 不 相关 的 , 协 方差 为 0. 这 一 点 , 犹 氏 分 布 与 逻辑 正 态 
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ee DF 





是 很 不 相同 的 .从 上 面 的 讨论 可 以 看 出 ,凡是 与 bh 正 交 的 向 量 ， 
也 靶 对 向 量 


1 2 ) 
= {Ln -bns 意 ， 
a ( E+1 | By nl (a (1) Ty 任意 


总 有 
Cov(a' to zo)) 

2_ li 人 920 ) ， 

= FI (1 | boydz) = 0. 
同样 地 ,对 

1 , . 

B= (bs ~ TeTeebte)o, 任意 ， 

也 总 有 


Cov{ xn, Pat) ) 
-60 (D+ -0 )/ At DD = 0 


适当 选择 w 与 ,使 Via = TVzzpB=1, 就 找到 了 一 对 不 相关 
的 典型 变量 a 与 gzt) .注意 到 如 此 选择 的 ,8 可 以 与 所 需 
的 成 对 典型 变量 的 数目 相符 ,这样 就 找 出 了 全 部 的 典型 相关 变量 . 
现在 引入 样本 矩阵 ,区 ，, 对 于 样本 矩阵 X, 相 应 的 样本 协 广 
差 阵 是 : 


s = 一 -= XC -1K)X 





= (XK nit ), 


班 一 二 
其 中 三 = 工 X'T, 三 是 忆 的 无 偏 估计 ， 
将 成 分 向 量 z 分 成 两 段 :: :下 二 (x ;12)》; 相 应 的 四 也 分 成 
两 个 子 阵 , 即 
= (Xi Xz)， 
同样 地 x 也 分 成 相应 的 开局, 式 (y; 于 是 
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加 | k+l1 
lS Sz)p~-k’ 

(na -1)Su = XX- nF Ty, 

(n 1)Sz = X22N2 — NE) Ff); 

(rn -1)S12 一 其 以 2 RE) FE2): 
但 样本 协 差 阵 并 不 怕 总 性 分 布 所 对 应 的 协 差 阵 , Siz 的 秩 会 大 于 
1 .然而 我 人 知道 应 该 只 有 一 个 非 零 的 奇异 值 ,所 以 只 需 考 虑 Si 
的 最 大 的 奇异 值 就 行 了 . 从 前 面 的 讨论 知道 ,这 个 奇异 值 就 是 1， 
因为 只 有 一 对 典型 变量 ,相关 系数 是 一 长 也 可 以 是 1 ,只 需 将 一 个 
系数 向 量 改 号 就 行 ). 因此 ,利用 这 一 特性 ,也 就 可 以 给 出 对 狭 氏 分 
布 参数 佑 计 的 方法 . 


$6. 贝 叶 斯 方法 


对 狄 氏 分 布 的 讨论 ,从 上 面 的 几 节 已 经 可 以 看 到 是 有 难度 的 . 
就 是 用 贝 叶 斯 方法 ,也 是 不 像 正 态 .指数 分 布 那样 ,可 以 有 -一些 明 
确 的 表达 式 , 主要 困难 在 于 后 验 分 布 的 形式 很 复杂 ,难以 计算 .这 
一 节 介 绍 的 是 用 MCMC 方法 ( 马 可 夫 链 蒙 特 卡 罗 方法 ) 得 到 的 一 
些 结论 ,详细 的 内 容 可 参看 文献 [6]. 

尽管 犹 氏 分布 是 指数 族 分 布 的 一 个 成 员 ,这 从 指数 族 的 定义 
很 快 就 可 以 得 到 ,但 它 的 共 斩 先 验 并 不 好 处 理 .我 们 现在 来 看 一 下 
这 个 困难 所 在 ， 

指数 族 的 定义 是 这 样 的 : 若 样本 zx 的 分 布 密度 p(x;0) 具 有 
下 述 (6.1) 的 形式 , 则 称 分 布 属于 指数 族 分 布 , 即 要 求 

p(x30) = C(O g(x)e OR, (6.1) 
其 中 6 是 未 知 参 数 ,z(z) 是 样本 x 的 函数 ,是 统计 量 . 
上 式 也 可 以 有 另 一 种 表示 法 , 即 (6.1) 可 改写 为 
p(x10) = g(r)e RH KN, 《6 .21 
只 要 取 %(8) =ln 二 就 行 7. 
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关于 指数 族 分 布 ,有 许多 好 的 性 质 ,例如 ,z(z) 是 充分 统计 
量 , 期 望 和 方 莽 协 方差 矩阵 会 有 好 的 表达 式 等 等 ,这 里 着 重 于 它 的 
共 移 先 验 分 布 .对 于 (6.2) 式 ,容易 看 出 ,如 果 我 们 选用 先 验 分 布 有 
如 下 的 形式 : 
xa(0| na) = Kp Ae sD We) (6.3) 
那么 ,用 贝 叶 斯 公式 ,就 得 后 验 分 布 


KK) 宕 [有 一 a + 了 中 





h(O|x)= [e (rR Gardve gg 
可 见 (6.3) 与 h(91z) 仍 属于 同一 类 型 ,也 即 有 
ha{0|x) = x(0|r + t(zx),A+1). (6.4) 
因此 贝 叶 斯 方法 能 否 比 较 好 用 , 与 46.3) 式 给 出 先 验 分 布 
x(9 F,) 是 和 殖 好 处 理 就 密切 相连 . 
容易 验证 狂 氏 分 布 D(ao,a1,…,ap) 是 居于 指数 族 分 布 的 ， 





因为 它 的 密度 
r( Yo) 
plx Tp 0 Gp) 一 四 Tx! 
1 Pei) 
一 (ar) rr) , 
其 中 


各 = Sai,z0 =1-— 六 ni， 
让 i=1 


Ti> 0, Vz < 1. 
i 
因此 ,相应 于 (6.2) 中 的 
1 {zx) 二 (inzoylnrl ynzp)， 
民 ( 的 =a = (a0,.at;'"* ,ap),， 


p08) = Dro) 一 r(3a,), 


E 一 必 


参数 
. G6=a= R(G). 
因此 共 轿 的 先 验 分 布 是 . 


xlalp,A) = K (Cp)e ee), 一 
注意 到 gfta) 是 一 个 很 复杂 的 函数 ,所 以 实际 上 是 急难 处 理 的 . 
为 了 说 明 这 一 点 ,我们 看 一 个 最 简单 的 情形 , 贝 他 分 布 的 密度 
plzi0,,) -0 — rr<l, 
x ,0 | LAY OC zi(l 一 工 ]mae ME) 
其 中 
(80) 一 InT(81) + InT'(0,) 一 lnT'(a 十 9)， 
符号 民 表 示 两 端 只 少 一 个 与 变量 册 , 包 无关 的 常数 因子 . 即使 认 
为 及 已 知 
2 
ri0 | pA) (于 全 二 全 ;= 0， 
此 时 后 验 分 布 
hl | zr,A)ce | 


这 也 是 很 不 好 处 理 的 . 

就 是 对 无 信息 先 验 分 布 ,因为 ao,al,…，,ar 的 变化 范围 是 
访 +1 维 空间 中 无 界 的 正 象 限 , 所 以 也 要 作 一 些 修改 ,才能 算出 一 
些 结 果 . 下 面 我 们 扼要 地 介绍 一 下 MCMC 方法 ,然后 列 出 用 这 个 
算法 求 得 的 数字 结果 ,不 难看 出 ,这 一 方法 对 于 上 面谈 到 的 共 轰 先 
验 分 布 是 行 得 递 的 . 

MCMC 方法 通常 有 两 种 算法 ,这 里 用 的 是 Metropolies 算法 . 
这 个 算法 的 要 点 是 这 样 的 : 

对 给 定 的 密度 p(w | zx) , 选 一 个 辅助 的 密度 gr(w,z), 它 对 每 
个 & 是 一 个 vv 的 窗 度 ,并 且 它 是 ,wv 的 对 称 函 数 , 即 有 

g(tu,v) = g(v,u). 





了 (6 + 02) 


A+l 8 
了 (82) ) (1 — x)2, 
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于 是 可 以 有 一 个 算法 如 下 : 

(1) 记 & 的 值 在 第 上 步 开 始 时 是 w = zt ,于 是 从 q(w,w) 
中 取 一 个 样本 wv， 

(2) 计 算 T=plv| zr)/plu' |x). 

(3) 若 TBT, 取 2tn= ao: 若 P<1, 则 

Gy ta 
” takerD, 按 概率 1 -古来 取 . 

这 样 继续 下 去 ,实际 上 , 当 一 co 时 ,xi 依 分 布 收 伍 于 密度 为 
plu| 工 ) 的 随机 变量 ,而 且 p(w|z) 可 已 选 LCulx)x(n),L(u|lzr) 
是 似 然 酒 数 ,x{u) 是 选 定 的 先 验 分 布 . 

对 于 狭 氏 分 布 D(al,a2,…,aj), 取 


点 
.A = aj,M 是 一 个 大 的 正 数 ， 
i=1 


1 一 
rlal,*', ) Oc 4 它 对 一 4 < er 


于 是 
TA | i# nn a 
六 (al yat| z)oc 4 到 站 (la,) | 





再 将 参数 人 上 ”位 作 变 换 ; 
8 =logit (a /A),i = 1,2, hk- 1 





QO =InA ,而 logit x = In 于 
afuvu) 选 正 态 分 布 ,期 望 向 量 是 zx , 协 方差 矩阵 选 9 的 信息 阵 估 
计 值 28 乘 以 c? ,而 

31 8 一 1 

i- .6s 
c=2.44 于 ,这 样 选 的 理由 是 由 别人 提供 的 经 验 . 

下 面 的 便 子 是 关于 北京 聘 各 种 蛋白 质 在 血 效 中 的 相对 比例 ， 








甫 6.1 三 种 重 有 质 的 相对 比例 
x1: 胎 蛋白 x2: 强 户 x3: 球 蛋白 





























EI 2 3 工 | 开 2 工 3 
”0.178 0.346 0.476 0.060 0.435 0.505 
0.162 0.307 0.531 0.089 0.418 0.493 
0.083 0.448 0.469 0.050 0.485 站 .465 
D0.087 0.474 0.439 0 .9073 0.378 0.549 
0.078 0.503 0.419 0.064 0.562 0.374 
0.040 0.456 0. 504 0.085 0.465 0.450 
G.049 0.363 0.588 0.094 0.388 0.518 
0.100 0.317 0. 583 0 .014 0.449 0.537 
0.075 0.394 0.531 0.060 站 ,544 0.395 
0.084 0.445 0.471 0.031 0.569 0.400 
口 0.m5s 0.491 站.484 
[J] 口 0.045 0.613 0.,342 
口 口 0.0195 0.526 .4545 











最 旱 是 由 文献 [了] 中 给 出 的 狄 氏 分 布 移 最 大 似 然 估计 值 ,现在 在 文 
献 [5] 中 ,用 上 述 MCMC 方法 算出 相应 的 入 ,以 便 比 较 . 


此 时 A=aitazta3,01=logit 守 ,b2=logit 各 ,0 =logA， 


注意 logit x =log T=. 
将 数据 代 和 变换 后 的 后 验 密 度 , 求 得 后 验 密度 的 众 数 (mode) 
是 


6 =~ 2.55713， 6 = - 0.201658， 人 =3.78617. 
并 求 得 由 {6.4) 得 
0.0133824 x 国 
>) ; = |- 0.00173654 0.00385699 * 
-0.00611651 0.000732927 0.044459 
相应 的 相关 矩阵 是 
1 一 0.241441 …0.2503691 
R= | > 1 0.0547773 


区 其 1 
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经 过 800 次 迁 代 ,稳定 后 再 进 人 下 一 阶段 . 这 样 就 可 以 用 MCMC 
求 得 参数 估计 . 


由 于 有 先 验 信息 知道 0< Ex1< 汪 ,因此 先 验 分 布 的 选择 是 在 
[0,3 Ix [0,1 x fe ,et] 
上 的 均 名 分布. 现 列 表 给 出 文献 [7] 中 最 大 似 然 的 结果 , MCMC 给 
出 的 结果 ,以 便 比较 . 


甫 6.2 最 大 你 然 的 估计 值 
参 数 最 大 似 热 估计 时 0% 置 稍 区 间 


a 了 ,22 (1.11,4.33) 
2 20. 知 (13.20,27.4&) 
总 3 21.68 (14.14,29.23) 








MCMC 的 结果 可 以 求 出 分 位 数 的 值 ,所 以 对 分 位 数 作 比 较 就 更 有 
意义 ， 


囊 6.3 参数 居 计 的 分 位 数 漠 





盘 数 
文献 [7] 妇 ] 
的 结果 as 

ek] 
MCNMC Ql 
的 结果 Aas 
| 








从 这 些 数 值 就 可 以 看 出 ,结果 是 非常 接近 的 . 

因此 对 MCMC 方法 ,应 该 尽 可 能 给 以 介绍 ， 国内 这 一 方面 的 
材料 还 不 多 . 

全 书 到 此 就 结束 了 ,在 这 一 章 中 ,提出 了 一 些 处 理 狭 氏 分 布 问 
题 的 想法 ,展示 了 一 些 计 算 结 果 , 目 的 是 说 明 它 的 难处 ,但 也 不 是 
完全 没有 办 法 解决 . 





我 们 没有 讨论 假设 检验 问题 ,主要 困难 在 于 似 然 比 的 统计 量 
给 不 出 表达 式 , 实 际 上 也 难以 使 用 .用 贝 时 斯 方法 同样 涉及 后 验 分 
布 的 计算 ,必须 详细 介绍 MCMC 方法 ,这 又 扩大 了 本 书 的 内 容 , 因 
此 只 能 作罢 . 


习 题 四 


1. 证 明 公 式 (2.7).( 注 意 习题 三 中 4 的 定义 ) 
2, 如 何 求 出 (2.7) 的 表达 式 . 利 用 Dt5)- 到 的 秩 是 1, 并 且 人 是 它 的 0 
特征 值 对 应 的 特征 向 量 , 园 此 记 AA=D(5) 一 部“ 后 ,就 有 


_T_ _ 1 1 Ary 
AA+!= | prilli=A 我， 
于 是 可 以 令 
A'~ Dib-l yall +atbl +1b), 


热 后 代 人 求 a1 ,az 的 值 . 


3. 求 出 At ,Ao) 的 渐 近 方 莽 . 

4. 对 狼 氏 分 布 Dao,a ,ap) ,统计 其 (nre,lhri,… ,Inzy) 是 (ao， 
Qt 10p) 参 数 的 充分 统计 景 , 它 是 不 是 完备 的 ? 

5. 用 GMM 方法 时 ,用 信息 阵 作 为 度量 的 炬 阵 , 能 和 否 写 出 有 关 的 算法 ? 


参考 文 贾 


[1] Hemilton, J]. D. (1994),Time Series Analysis, Princeton TUniversity Press. 

[2] 张 疾 庭 、 方 开 泰 (1982 ,1998) , 堵 元 统计 分 析 引 论 , 科 学 出 版 社 . 

[3] 张 关 庭 (1 和 91), 定 社 资 料 的 统计 分 析 , 广 西 师范 大 学 出 版 社 . 

[4] Gupia, R. D. and Richards,D {1990), The Dirichlet diatributions and pojynomial re- 
Bression, Journal of Miultivariate analysis, 32 ,95—102. 

[51 章 株 赎 (1999) , 虑 分 数据 的 几 个 佑 诗 { 待 发 表 );Payesian inference on compositional 
ata satmpling irom Dinchlet 赴 stribution.( 待 发 表 ). 

[6] Tanner,M. A, (1996), Tools for Statistical Inference (Third Edition), Springer. 

[7] Mosimann, J. E. {1962} ,On the compound raultnomisl distribution, the muitivariate 
Fdistiibution, and correlations among proportions, Biometrika,49.,65—B81. 


”163 ， 





汉 英名 询 对 照 潮 党 


三 西 
大 小 size (1.2) 
子 成 务 。 sbobcompositon (1.2) 
广 尽 矩 估 计 法 generalized moment 
estimate method {4.1) 


怠 氏 链 莹 特 卡 曙 方法 ,MCNMIC 方法 
Markov chain ”Monie-Caric 
method (4.6) 

四 症 


页 他 分 布 beta distribution 【1.5) 

方向 性 数据 的 分 布 directiona]l data 
distribution {2.5) 

尺 讼 scale (2.5) 

内 叶 斯 方法 Bayesian merhod 
(4.6) 

五 遂 

对 比 ”comtraat (1.,2) 

正 态 分 布 “normal (Gauss) distribu- 
tion (1.3) 

一 密 元 正 态 mltivariate nonmal 
{1.3) 

一 标准 正 态 standard nomnal 
(1.3) 

一 反正 奢 inverse Gaussian (11:3) 

~ 一道 反正 态 teciprocal inverse Gaus- 
sian (1.3) 

一 对 数 正 态 。 lognormal (1.4} 

正 态 密度 ponmal density (1.3) 

正 态 分 布 的 特征 函数 ”characteristic 
function of nomrnal distribution 
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对 才 东 -EtE (2.2) 
对 数 对 比 ”logcontrast {2.2) 
主 分 量 principle component (3.3) 
六 画 
成 分 “comjosition 【1.2) 
各 向 同性 isotropie covariance 
《2 2》 
七 画 
形状 shape (1.2) 
即 马 分 布 gamma distribution 
{1.5) 
狭 氏 分 布 Dirichlet distribution 
{1.5) 
一 道 狭 民 分 布 “inverse Diriehiet dis- 
tribution (1.5) 
关 草 信息 量 discriminate information 
(3.3) 
不 画 
径 可 分 分 布 radially decornposable 
distribution (2.5) 
鲍 性 模型 ”linear model {4.1) 


九 面 
总 量 total (1.2) 
十 一 丙 
基 basia (1.2) 


基本 问 量 base vector 《2.5) 

球 对 称 spherical syrnrnetric (2.5) 

村 面 上 均 当 sphencal mmiform 
(2.5) 


a a 


